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内 容 简介 
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验 ,学 习 解 决 实际 问题 常用 的 数学 方法 ,并 在 此 基础 上 分 析 .解决 经 过 简化 的 实际 问题 ,提高 学 数学 与 用 
数学 的 兴趣 ,意识 和 能 力 。 本 书 通过 14 个 实验 介绍 数值 计算 .优化 方法 和 数理 统计 的 基本 原理 .有 效 算 
法 及 软件 实现 ,并 提供 若干 简化 的 实际 问题 ,让 读者 利用 学 到 的 数学 方法 及 适合 的 数学 软件 在 计算 机 上 
完成 数学 建 模 的 全 过 程 。 本 书 适用 于 学 过 微 积分 和 线性 代数 的 读者 进一步 提高 利用 数学 工具 和 计算 机 
技术 分 析 ,解决 实际 问题 的 能 力 。 
本 书 可 作为 高 等 院 校 理工 经管 类 专业 数学 实验 ,数学 建 模 课程 的 教科 或 参考 书 ,大 学 生 数 学 建 模 
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电子 计算 机 的 出 现 和 飞速 发 展 是 20 世纪 科学 家 和 工程 师 对 人 类 做 出 的 最 伟大 的 贡 
献 之 一 。 今 天 ,不 论 你 走 进 大 型 工厂 的 控制 间 、 建 筑 公 司 的 设计 室 , 还 是 政府 机 关 的 办 公 
楼 .学 校 的 多 媒体 教室 ,计算 机 都 会 立刻 进入 你 的 眼帘 。 刷 卡 购物 、 刷 卡 乘 车 .刷卡 人 住 、 
刷卡 注册 …… 人 们 的 日 常生 活 越 来 越 离 不 开 计 算 机 。 今 天 我 们 难以 想像 在 不 久 的 未 来 计 
算 机 会 给 人 类 生活 带 来 多 么 巨大 的 变化 。 

数学 作为 一 门 研究 现实 世界 数量 关系 和 空间 形式 的 科学 ,在 它 产 生 和 发 展 过 程 中 ,一 
直 是 和 人 们 的 实际 需要 密切 相关 的 ,历史 上 许多 科学 技术 的 重大 发 明 都 离 不 开 数学 ,电子 
计算 机 的 出 现 也 应 归功 于 数学 家 的 黄 基 性 工作 。 反 过 来 ,科学 技术 和 生产 活动 的 进步 ,又 
促进 了 数学 的 发 展 。 特 别 是 电子 计算 机 技术 的 飞速 进步 为 古老 的 数学 提供 了 威力 巨大 的 
工具 ,彻底 改变 了 长 期 以 来 仅 靠 一 张 纸 , 一 支 笔 做 数学 题 的 传统 ,使 数学 的 应 用 在 广度 和 
深度 上 都 达到 了 前 所 未 有 的 程度 ,促成 了 从 数学 科学 到 数学 技术 的 转化 ,并 使 数学 技术 成 
为 当今 高 科技 的 一 个 重要 组 成 部 分 和 显著 标志 。 同 时 也 把 数学 从 数学 家 的 书斋 里 和 课本 
中 解放 出 来 ,成 为 各 行 各 业 认识 自然 .改造 社会 的 有 力 武器 。 

教育 必须 跟踪 、 反 映 并 预见 社会 发 展 的 需要 ,大 学 的 数学 教育 更 应 如 此 。 我 们 看 到 ， 
先是 出 现 了 一 些 计 算 机 语言 和 编写 程序 的 课程 ,让 学 生 熟 悉 和 学 会 使 用 计算 机 ,继而 引入 
各 种 形式 的 数学 建 模 课程 , 架 起 数学 知识 和 应 用 之 间 的 桥梁 ,弥补 了 学 生 学 完 传统 数学 课 
程 仍 不 会 用 的 缺陷 ,对 数学 教学 改革 起 了 显著 的 促进 作用 。 但 是 上 面 两 类 课程 尚未 很 好 
地 融合 ,计算 机 程序 一 类 课程 很 少 涉及 数学 的 应 用 ,数学 建 模 课程 又 往往 是 纸上谈兵 ,学 
生 少 有 机 会 自己 动手 ,用 计算 机 这 个 强 有 力 的 工具 去 分 析 、 解 决 哪怕 是 简化 的 实际 问题 。 
目前 正 茵 勃 开展 的 全 国 大 学 生 数 学 建 模 竞赛 ,可 以 说 是 二 者 相 结合 的 一 个 范例 ,而 那 毕竟 
只 是 少数 学 生 参 加 的 课外 科技 活动 。 

作为 探索 计算 机 技术 和 数学 软件 引入 教学 后 数学 教育 改革 的 一 项 尝试 ,1996 年 在 教 
育 部 立项 的 面向 21 世纪 非 数学 专业 数学 教学 体系 和 内 容 改革 的 总 体 构想 中 ,把 “数学 实 
验 ” 列 为 数学 基础 课 之 一 ,清华 大 学 数学 系 参加 了 这 项 教改 的 一 个 课题 组 ,并 于 1998 年 进 
行 了 数学 实验 课 的 试点 。 在 此 基础 上 姜 启 源 等 编写 了 《数学 实验 ) 一 书 ( 痕 树 铁 教授 主编 
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的 面向 21 世纪 课程 教材 (大 学 数学 》 丛 书 中 的 一 本 ,高 等 教育 出 版 社 1999 年 出 版 ) 。 

近 几 年 国内 不 少 高 等 院 校 相继 开设 了 数学 实验 课 ,也 出 版 了 好 玫 本 教材 ,从 中 可 以 看 
出 ,大 家 对 于 这 门 课程 基本 宗旨 的 认识 大 体 上 是 一 致 的 , 即 以 学 生 在 计算 机 上 动手 、 动 腿 、 
动脑 为 主 , 在 教师 的 指导 下 ,通过 用 数学 软件 做 实验 ,学 习 解 决 实际 问题 常用 的 数学 方法 ， 
分 析 、 解 决 经 过 简化 的 实际 问题 ,提高 学 数学 .用 数学 的 兴趣 .意识 和 能 力 。 当 然 ,在 课程 
的 模式 和 实验 的 内 容 上 ,各 校 根据 各 自 的 具体 情况 有 所 不 同 , 这 是 十 分 正常 的 现象 ,应 当 
鼓励 不 同形 式 的 课程 模式 、 内 容 和 方法 的 大 胆 探索 。 

在 清华 大 学 新 制定 的 非 数 学 类 专业 数学 教学 体系 中 ,数学 实验 是 4 门 主干 课程 的 最 
后 一 门 (前 3 门 是 微 积分 .代数 与 几何 、 随 机 数学 方法 ) ,起 着 承 上 ( 上 述 3 门 数学 课 ) 、 启 下 
(后 续 课 ,研究 生 课 程 及 数学 的 应 用 ) 的 作用 。 我 们 将 它 设计 为 一 门 重组 课程 , 集 数值 计 
算 、 优 化 方法 、 数 理 统计 数学 建 模 以 及 数学 软件 于 一 体 ,以 “了 解数 学 基本 原理 .知道 主要 
数值 算法 ,会 用 数学 软件 实现 .培养 数学 建 模 能 力 ” 为 基本 要 求 , 使 之 既是 上 述 3 门 数学 课 
程 的 巩固 和 提高 ,又 在 基本 数学 知识 和 数学 的 应 用 之 间架 起 一 座 桥梁 。 

目前 不 少 院 校正 在 开展 “本 硕 贯 通 ” 的 教育 改革 ,本 科 阶 段 的 数学 实验 课 只 介绍 相关 
数学 知识 的 基本 原理 方法、 软件 实现 及 其 应 用 ,为 研究 生 阶 段 要 求 掌握 更 深入 的 理论 和 
方法 的 数学 课程 (如 数值 分 析 、 数 学 规划 、 高 等 数理 统计 等 ) 提 供 了 许多 实际 背景 ,也 留 下 
了 一 些 需 要 进一步 解决 的 问题 ,从 而 刺激 了 学 生 再 学 习 的 愿望 。 . 

按照 上 述 的 基本 思路 ,从 2000 年 起 清华 大 学 在 全 校 范围 内 大 规模 地 开设 数学 实验 
课 ,每 学 期 3 一 4 个 大 班 (每 班 约 200 人 ) ,得 到 同学 们 的 肯定 和 好 评 ,我 们 也 在 教学 中 不 断 
明确 和 修正 这 门 课程 的 指导 思想 和 目的 要 求 , 逐 步 改进 和 完善 课程 的 具体 内 容 和 教学 方 
法 ,这 本 教材 就 是 在 4 年 来 教学 实践 的 基础 上 由 主要 授课 教师 集体 编写 的 。 

基于 上 面 的 认识 与 实践 ,这 本 教材 的 编写 遵循 了 以 下 原则 

1. 在 上 述 3 门 数学 主干 课程 的 基础 上 ,介绍 一 些 最 常用 的 解决 实际 问题 的 数学 方 
法 ,包括 数值 计算 、 优 化 方法 和 数理 统计 的 基本 原理 及 主要 算法 ,一 般 不 讲 证 明 ,基本 上 不 
做 笔头 练习 。 

2. 选择 合适 的 数学 软件 平台 (以 MATLAB 为 主 , 辅 之 以 LINDO 和 LINGO)，, 能 够 
方便 地 满足 以 上 内 容 的 软件 实现 。 

3. 数学 建 模 的 思想 和 方法 贯穿 全 书 ,从 建 模 初 步 练习 开始 ,以 建 模 综合 练习 结束 ,每 
个 实验 尽量 从 实际 问题 的 建 模 引入 ,并 落实 于 模型 的 求解 。 

4， 精心 安排 学 生 的 实验 ,学生 自 己 动手 在 计算 机 上 做 练习 的 时 间 和 条 件 必 须 保 证 ， 
建议 讲课 与 实验 的 学 时 比例 至 少 为 1 : 2, 并 且 对 实验 报告 的 内 容 和 格式 提出 明确 的 
要 求 。 ， 
按照 这 些 原则 本 书 共 包含 14 个 实验 :数值 计算 5 个 实验 ,优化 方法 3 个 实验 数理 统 
计 3 个 实验 、 数 学 建 模 2 个 实验 ,另外 还 有 人 工 神经 网 络 1 个 实验 。 这 些 实验 基本 上 相互 
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独立 ,教师 可 根据 具体 情况 选用 。 一 个 实验 的 内 容 可 在 3~ 4 学 时 内 讲 完 。 每 个 实验 都 备 
有 充分 的 、 供 学 生动 手 做 的 练习 ,部 分 练习 题 附 有 提示 或 参考 答案 。MATLAB 的 基本 用 
法 编 人 附录 。 

针对 数学 实验 课 需 要 知识 面 广 .实例 多 .计算 方法 与 软件 实现 相互 交叉 等 特点 ,课堂 
讲授 宜 采 用 多 媒体 教学 ,可 以 做 到 实例 生动 .信息 量 大 、 便 于 接受 。 我 们 研制 了 与 本 书 配 
套 的 多 媒体 课件 , 交 由 清华 大 学 出 版 社 出 版 。 

本 书 实验 1,2,12,14 由 姜 启 源 编写 ,实验 3,10,11,13 由 邢 文 训 编写 ,实验 6,7,8,9 
及 附录 由 谢 金星 编写 ,实验 4,5 由 杨 顶 辉 编 写 , 张 立 平 统 编 了 部 分 实验 练习 的 参考 答案 ， 
黄 红 选 、 张 立 平 参 加 了 审阅 ,全书 由 姜 启 源 统 稿 。 在 清华 大 学 讲授 过 数学 实验 课 的 还 有 李 
建国 . 李 津 等 ,他 们 都 对 这 本 教材 的 编写 做 出 了 贡献 ,在 此 表示 衷心 的 感谢 。 
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数学 建 模 指 的 是 建立 ,求解 .分 析 和 验证 一 个 实际 问题 的 数学 模型 的 全 过 程 , 这 个 实 
验 在 简要 说 明 什么 是 数学 模型 之 后 ,通过 几 个 实例 介绍 建立 数学 模型 的 过 程 , 以 及 数学 实 
验方 法 在 建 模 中 的 应 用 ,然后 归纳 数学 建 模 的 基本 方法 和 步骤 ,并 简单 阑 述 学 习 数学 建 模 
的 重要 意义 . 


1.1 什么 是 数学 建 模 


人 们 在 认识 .研究 现实 世界 里 的 某 个 客观 对 象 时 ,常常 不 是 直接 面 对 那 个 对 象 的 原 
型 ,而 是 设计 构造 它 的 各 式 各 样 的 模型 ; 玩具 、 照 片 及 展览 厅 里 的 三 峡 大 坝 模 型 神舟 飞 
船 模型 是 直观 且 形 象 的 实物 模型 ;水 箱 中 的 舰艇 模型 用 来 模拟 波浪 冲击 下 舰艇 的 航行 性 
能 , 风 洞 中 的 飞机 模型 用 来 试验 飞机 在 气流 中 的 动力 学 特性 ,它们 是 工程 师 们 进行 舰艇 、 
飞机 设计 时 用 的 物理 模型 ;汽车 司机 对 方向 盘 的 操纵 ,钳工 师傅 对 工件 的 手工 操作 ,依赖 
于 他 们 头脑 中 的 思维 模型 ;人 们 常用 的 地 图 ,电工 .电子 设计 中 用 的 电路 图 ,化 学 中 的 分 子 
结构 图 ,是 经 过 某 种 抽象 并 按照 一 定形 式 组 合 起 来 的 符号 模型 . 这 些 模 型 都 是 人 们 为 了 一 
定 目的 ,对 客观 事物 的 某 一 部 分 进行 简 缩 .抽象 .提炼 出 来 的 原型 的 替代 物 , 它 虽 不 是 原型 
的 复制 品 , 却 集中 反映 了 原型 中 人 们 需要 的 那 一 部 分 特征 ,因而 有 利于 人 们 对 客观 对 象 的 
认识 ， 

数学 模型 (mathematical model) 当然 比 上 面 这 些 模 型 更 加 抽象 , 它 是 当 人 们 要 认识 客 
观 对 象 在 数量 方面 的 特征 .定量 地 分 析 对 象 的 内 在 规律 .用 数学 的 语言 和 符号 去 近似 地 刻 
画 要 研究 的 那 一 部 分 现象 时 ,所 得 到 的 一 个 数学 表述 . 建立 数学 模型 的 过 程 简称 为 数学 建 
模 (mathematical modeling). 

数学 建 模 似乎 是 个 新 名 词 ,其 实 作为 用 数学 方法 解决 实际 问题 的 第 一 步 , 它 与 数学 本 
身 有 着 同样 悠久 的 历史 , 两 于 多 年 前 创立 的 欧 几 里 得 几何 ,17 世纪 发 现 的 牛顿 万 有 引力 
定律 ,都 是 科学 发 展 史 上 数学 建 模 的 成 功 范 例 . 在 我 们 日 常生 活 中 数学 建 模 的 应 用 也 不 少 
见 ,贷款 买房 时 比较 各 种 不 同 的 还 款 方案 ,校园 和 居民 小 区 里 为 限制 车 速 而 设计 路 障 ,为 
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肥胖 者 安排 合理 有 效 的 减肥 方案 ,都 可 以 建立 简单 的 数学 模型 加 以 解决 . 
为 了 具体 地 说 明 数 学 建 模 过 程 中 的 要 点 , 举 一 个 中 学 课程 中 学 过 的 “航行 问题 >: ， 
甲乙 两 地 相距 750km, 船 从 甲 地 到 乙 地 顺水 航行 需 30h, 从 乙 地 到 甲 地 逆水 航行 需 
50h, 问 船 的 速度 是 多 少 . | 
读者 大 概 是 这 样 做 的 : 用 zx，y 分 别 表示 船 速 和 水 速 , 列 出 方程 
(zx 二 +y) X30 = 750,， 
人 X50 = 750. 
求解 得 到 x 一 20, y 一 5, 于 是 回答 船 速 为 20km/h. 
这 是 一 个 代数 应 用 题 , 稍 微 仔细 分 析 一 下 解 这 道 题 的 过 程 ,里 面 已 经 包含 了 建立 数学 
模型 的 基本 内 容 , 即 
。 根据 问题 背景 和 建 模 目 的 做 出 必要 的 简化 假设 一 一 航行 中 船 速 各 水 速 均 为 常数 ; 
。 用 字母 和 符号 表示 有 关 的 量 一 一 +x，y 分 别 表示 船 速 和 水 速 ; 
。 利用 相应 的 物理 (或 其 他 ) 规 律 一 一 匀速 运动 的 距离 等 于 速度 乘 以 时 间 , 列 出 数学 
式 子 一 一 二 元 一 次 方程 ; 
。 求解 方程 ,得 到 数学 上 的 解答 工 一 20，y 一 5; 
用 这 个 结果 回答 原 问题 船 速 为 20km/h; 
对 于 实际 问题 ,以 上 结果 必须 用 实际 信息 来 检验 . 
一 般 地 说 ,为 了 定量 地 解决 一 个 实际 问题 ,从 中 抽象 .归结 出 来 的 数学 表述 就 是 数学 
模型 . 详细 一 点 ,数学 模型 可 以 描述 为 ,对 于 现实 世界 的 


个 研究 中 出 | 到 交 对象 表述 效 学 模型 
一 个 研究 对 象 ,为 了 一 个 特定 目的 ,做 出 必要 的 简化 假 | 的 信息 

设 , 根 据 对 象 的 内 在 规律 ,运用 适当 的 数学 工具 ,得 到 的 yj i 
一 个 数学 表述 . 而 数学 建 模 包括 模型 的 建立 .求解 .分 析 

和 检验 的 全 过 程 . 从 实际 问题 到 数学 模型 ,又 从 数学 模型 | 加 入 宪 人 


的 求解 结果 回 到 现实 对 象 , 数 学 建 模 的 全 过 程 可 以 表示 
为 图 1. 1. 

图 1.1 揭示 了 现实 对 象 和 数学 模型 的 关系 . 一 方面 ,数学 模型 是 将 现象 加 以 归纳 、 抽 
象 的 产物 , 它 源 于 现实 ,又 高 于 现实 . 另 一 方面 ,只 有 当 数 学 建 模 的 结果 经 爱 住 现实 对 象 的 
检验 时 , 才 可 以 用 来 指导 实际 ,完成 实践 一 一 理论 一 一 实践 这 一 循环 . 


1.2 数学 建 模 实 例 与 数学 实验 方法 


本 节 介 绍 几 个 数学 建 模 的 实例 ,并 说 明 数 学 实验 方法 在 建 模 过 程 中 的 应 用 . 


图 1.1 数学 建 模 的 全 过 程 


1.2 数学 建 模 实例 与 数学 实验 方法 


1.2.1 汽车 刹车 距离 


问题 汽车 司机 在 行驶 过 程 中 发 现 前 方 出 现 突 发 事件 ,会 紧急 刹车 ,人 们 把 从 司机 决 

定 刹 车 到 车 完全 停止 这 段 时 间 内 汽车 行驶 的 距离 , 称 为 刹车 距离 . 常识 告诉 我 们 ,车 速 越 

. 快 ,刹车 距离 越 长 . 那么 ,刹车 距离 与 车 速 之 间 是 线性 关系 ,还 是 更 复杂 的 关系 . 为 了 得 到 

二 者 之 间 的 数量 规律 ,首先 做 了 一 组 实验 : 用 固定 牌子 的 汽车 ,由 同一 司机 驾驶 ,在 不 变 

的 道路 、 气 候 等 条 件 下 ,对 不 同 的 车 速 测量 其 刹车 距离 ,得 到 的 数据 如 表 1. 1. 试 从 物理 上 
的 分 析 入 手 ,参照 这 组 数据 ,建立 刹车 距离 与 车 速 之 间 的 数学 模型 ， 


表 1.1 和 车速 和 刹车 距离 的 一 组 数据 


车 速 /km/h 
刹车 距离 /m 


问题 分 析 为 了 更 直观 起 见 , 用 MATLAB 对 表 1. 1 的 数据 作 图 (图 1. 2), 可 以 看 
到 ,刹车 距离 与 车 速 之 间 并 非 线 性 关系 ,我们 需要 对 刹车 距离 从 机 理 上 作 较 仔细 的 研究 . 
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车 速 /km/h 
图 1.2 表 1.1 的 数据 {实际 刹车 距离 ) 


刹车 距离 由 反应 距离 和 制 动 距离 两 部 分 组 成 ,前 者 指 从 司机 决定 刹车 到 制动器 开始 
起 作用 这 段 时 间 内 汽车 行驶 的 距离 ,后 者 指 从 制动器 开始 起 作用 到 汽车 完全 停止 所 行驶 
的 距离 . | 

反应 距离 由 反应 时 间 和 车 速决 定 , 反 应 时 间 取 决 于 司机 个 人 状况 (灵巧 .机警 .视野 
等 ) 和 制 动 系统 的 灵敏 性 (从 司机 脚 踏 刹 车 板 到 制动器 真正 起 作用 的 时 间 ), 对 于 固定 牌子 
的 汽车 和 同一 类 型 的 司机 ,反应 时 间 可 以 视 为 常数 , 并 且 在 这 段 时 间 内 车 速 尚未 改变 

制 动 距离 与 制动器 作用 力 .车 重 . 车 速 以 及 道路 .气候 等 因素 有 关 , 制 动 器 是 一 个 能 量 
耗 散装 置 , 制 动力 做 的 功 被 汽车 动能 的 改变 所 抵消 . 设计 制动器 的 一 个 合理 原则 是 ,最 大 
制 动 力 大 体 上 与 车 的 质量 成 正比 ,使 汽车 大 致 做 匀 减 速 运动 ,司机 和 乘客 少 受 剧 烈 的 冲 
击 . 而 道路 .气候 等 因素 对 一 般 规 则 来 说 只 能 看 作 是 固定 的 ， 
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模型 假设 “基于 上 述 分 析 , 做 以 下 假设 : 

(1) 刹车 距离 4 等 于 反应 距离 d1 与 制 动 距 离 ds 之 和 . 

(2) 反应 距离 di 与 车 速成 正比 ,比例 系数 为 反应 时 间 . 

(3) 刹车 时 使 用 最 大 制 动 力 下 ,下 做 的 功 等 于 汽车 动能 的 改变 , 且 下 与 车 的 质量 m 成 

正比 . | 
模型 建立 ”由 假设 (2) ,有 . 

di = kiv, C1 

有 为 反应 时 间 . 由 假设 (3) ,在 下 作用 下 行驶 距离 4; 做 的 功 Fd; 使 车 速 从 wv 变 成 0, 动能 的 

变化 为 mw /2, 从 而 有 Fd; 二 mv /2. 又 下 与 m 成 正比 ,按照 牛顿 第 二 定律 可 知 ,刹车 时 

的 减速 度 a 为 常数 ,于 是 


ds = k,v,， (2) 
如 为 比例 系数 ,实际 上 已 一 元. 由 假设 (1) ,刹车 距离 为 
d = kivt kw. (3) 
人 150 


参数 估计 虽然 (3) 式 中 的 参数 ,有 有 
一 定 的 物理 意义 ,但 是 它们 难以 从 机 理 上 确 1!00 
定 ,常用 的 办 法 是 根据 表 1. 1 的 数据 来 拟 合 sl | 
(3) 式 中 的 参数 , 称 为 数据 拟 合 , 其 算法 及 软 

件 实现 将 在 实验 5 中 介绍 . 把 表 1. 1 中 车 速 2 4 0 80 10 120 140 
的 单位 先 化 成 m/s, 得 到 的 估计 结果 为 忆 一 图 1.3 计算 刹车 距离 曲线 
0.6522,k, 一 0.0853. 将 它们 代入 (3) 式 计算 

出 的 刹车 距离 列 在 表 1. 2 的 第 3 行 ,可 与 第 2 行 的 实际 刹车 距离 比较 . 计算 刹车 距离 曲线 
如 图 1. 3 所 示 . 


表 1.2 计算 刹车 距离 与 实际 刹车 距离 的 比较 
车 速 /km/h 20 40 60 . 80 100 120 | 140 
实际 刹车 距离 /m 6.5 7 33.6 57.1 83.4 118.0 
计算 刹车 距离 /m 


从 ki ,ks 的 估计 结果 可 知 , 反 应 时 间 为 &1 人 0. 65s, 刹 车 时 的 减速 度 a 一 
这 些 数值 是 根据 表 1. 1 的 数据 算出 的 ,并 不 具有 一 般 性 . 
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1.2.2 市 场 经 济 中 的 蛛网 模型 


问题 “在 自由 贸易 的 集 市 上 常会 出 现 这 样 的 现象 ; 一 个 时 期 以 来 某 种 消费 品 ( 如 鸡 
蛋 ) 的 上 市 量 远大 于 需求 ,由 于 销售 不 畅 致使 价格 下 跌 , 生 产 者 发 现 养 鸡 赔钱 ,于 是 转 而 经 
营 其 他 农 副 业 . 过 一 段 时 间 鸡 蛋 上 市 量 就 会 大 减 ,供不应求 将 导致 价格 上 涨 ,生产 者 看 到 
有 利 可 图 又 重 操 旧 业 ,这样 下 一 个 时 期 又 会 重 现 供过于求 .价格 下 跌 的 局 面 . 

商品 数量 和 价格 的 这 种 振荡 现象 在 自由 竞争 的 市 场 经 济 中 常常 是 不 可 避免 的 . 进 一 
步 的 观察 可 以 发 现 , 振 荡 有 两 种 完全 不 同 的 形式 ,一 种 是 振幅 逐渐 减 小 ,市 场 经 济 趋向 平 
稳 , 另 一 种 是 振幅 越 来 越 大 ,如 果 没 有 外 界 如 政府 的 干预 ,将 导致 经 济 朋 演 . 试 建立 一 个 简 
mi 研究 经 济 趋向 平稳 的 条 件 , 并 讨论 当 经 济 趋向 不 稳定 时 政府 

能 采取 的 干预 方式 . 

蛛网 模型 ”商品 在 市 场 上 的 数量 和 价格 出 现 反 复 的 振荡 ,是 由 消费 者 的 需求 关系 和 
生产 者 的 供应 关系 决定 的 . 记 商 品 第 时 段 的 上 市 数量 为 x, 价格 为 %. 这 里 我 们 把 时 间 
离散 化 为 时 段 ,1 个 时 段 相当 于 1 个 生产 周期 ,对 于 肉 、 a 
等 指 种 植 周期 . 

按照 经 济 规律 ,价格 头 依赖 于 数量 xz, 由 消费 者 的 需求 关系 决定 , 记 作 ys == (xi)， 

需求 函数 , 因为 上 市 数量 越 多 ,价格 越 低 , 所 以 了 是 减 函数 . 下 一 时 段 商 品 数量 zy1 依 
WE yx: 由 生产 者 的 供应 关系 决定 , 记 作 Tat1 =—=h( ye), 称 供 应 项 本 数 ， 因为 
价格 越 高 ,生产 量 ( 即 下 一 时 段 上 市 量 ) 越 大 ,所 以 hh 是 增 函 数 . 设 h 的 反 函 数 为 g, 即 yi 二 
8(ZXh+t1) ,8 也 是 增 函 数 . 

在 商品 数量 和 价格 变化 不 大 的 范围 内 ,可 以 将 f 和 g 简化 为 线性 函数 ,在 图 1. 4(a) 
和 图 1. 4(b) 中 用 两 条 直线 表示 ,它们 相交 于 Po 《xo，yo) 点 . Po 点 称 为 平衡 点 ,意思 是 一 
且 某 一 时 段 & 商品 的 上 市 量 zx 二 zo; 则 由 ys 王 f(z) 和 zati 王 hh(ys) 可 知 ,yx 二 yo， 
Tit1 王 To yyet1 王 y%，…， 即 以 后 的 上 市 量 和 价格 将 永远 保持 在 Po《xo，yo) 点 ;但 实际 上 
人 不 妨 设 zi 偏离 zo, 如 图 1. 4， 我 们 分 析 
ZZ， 的 变化 . 

”商品 数量 x, 给 定 后 ,价格 yj 由 直线 /上 的 P, 点 决定 . 数量 zz 又 由 yl 和 直线 g 上 的 
Ps, 点 决定 ,ys 由 x2 和 ff 上 的 P; 点 决定 ,这 样 在 图 1. 4(a) 上 得 到 一 系列 的 点 Pi，P,， 
P: ,这 些 点 按 图 上 第 头 方向 趋向 Po 点 , 称 Po 为 稳定 平衡 点 , 意 昧 着 商品 的 数量 和 价格 
的 振荡 将 趋向 稳定 . | 

但 是 如 果 直 线 f 和 g 由 图 1.4(b) 给 出 ,类 似 的 分 析 可 以 发 现 ,P， P,P;,… 沿 着 箭 
头 的 方向 ,将 越 来 越 远离 Po 点 , 称 Po 为 不 稳定 平衡 点 ,意味 着 商品 的 数量 和 价格 将 出 现 
越 来 越 大 的 振荡 ,图 1.4(a) 和 1.4(b) 中 的 折线 P,PsP… 形 似 蛛网 ,在 经 济 学 中 称 为 蛛网 
模型 . 
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为 什么 会 有 这 样 截然 相反 的 现象 呢 ? 分 析 一 下 图 1. 4(a) 和 图 1. 4(b) 的 不 同 之 处 就 
可 发 现 ,图 1.4(a) 的 了 比 六 平 , 而 图 1.4(b) 的 大 比 g 陡 .用 天/ 和 天 ,分 别 表示 广 和 fg 的 
斜率 ( 取 绝 对 值 ) ,可 以 看 出 ; 当 K/= K. 时 Po 稳定 ; 当 Ks> KK; 时 Po, 不 稳定 . 


(a) 蛛网 模型 ， Po 稳定 (b) 蛛网 模型 ， Po 不 稳定 
1.4 


方程 模型 ”为 了 定量 地 分 析 上 述 现 象 ,将 需求 函数 f 表示 为 


状 一 JJ 一 一 az 一 Zoo) o>0, k=1,2,. (4) 
供应 函数 hh 表示 为 
Zi 一 Zoo = Py my), B>0, k=1,2, (5) 
从 (4) 式 ,(5) 式 中 消去 内 可 得 
Zi 一 To 一 一 ap 一 TIo)， 开 一 1 2 (6) 


知道 了 Xo, yo ly0， p8, 可 以 用 (4) 式 ,(5) 式 或 (6) 式 计算 TE, Vk: 
为 了 讨论 时 间 充 分 长 以 后 ( 即 kco 时 )zi 的 变化 趋势 ,由 (6) 式 可 递 推 地 解 出 


TH 一 To = (—aB) (zl 一 Zoo)， k= 1,2, (7) 
显然 , 当 方 程 (6) 的 系数 ( 取 绝 对 值 ) 小 于 1, 即 
aB 二 1 或 a 过 1/8 (8) 
时 一 zosP 点 稳定 ;而 当 | 
ap>>1 或 aa>1/8 (9) 


时 xcoy Po 点 不 稳定 . 

注意 到 (4) 式 ,5) 式 的 系数 ,8 有 天 /一 w, Ks 二 1/B( 因 为 Ki 二 8), 所 以 条 件 (8),(9) 
与 蛛网 模型 中 的 分 析 是 完全 一 致 的 . 

看 一 个 例子 . 设 基 种 商品 在 市 场 上 处 于 平衡 状态 时 的 数量 为 zo 二 100( 单 位 ) ,yo 二 10 
《元 /单位 ) ,开始 时 段 商 品 数量 为 zx, 二 110. 若 上 市 量 减 少 1 个 单位 价格 上 涨 0.1 元 ,而 价 
格 上 涨 1 元 下 一 时 有 段 供应 量 增加 5 个 单位 , 即 a 二 0.1, 8 二 5, 则 按照 方程 (4) 及 方程 (5) 计 
算得 到 的 zi ,yr(k 二 1,2,…,10) 如 图 1.5 所 示 , 可 以 看 出 x ,yi 分 别 趋向 zo ,yo. 当 a 升 高 
至 0.24 时 (8 不 变 ) ,得 到 的 结果 如 图 1.6 所 示 ,zi ,yi 越 来 越 大 . 
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图 1.5 a=0.1,p=5 时 蛛网 模型 x ,yi 的 变化 
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图 1.6 c=0.24,5=5 时 蛛网 模型 x , 的 变化 


(4) 式 ,(5) 式 或 (6) 式 表示 了 ze， 闪 和 zt+l，yi+l 之 间 的 关系 , 称 为 差分 方程 ,实验 2 
将 专门 讨论 用 差分 方程 描述 的 离散 动态 过 程 . 

结果 解释 考察 c,8 的 含义 ,可 以 对 市 场 经 济 是 否 会 趋 于 平稳 做 出 合理 的 解释 . 由 
(4) 式 可 知 ,a 表示 商品 上 市 量 减 少 1 个 单位 时 价格 的 上 涨幅 度 ; 由 (5) 式 可 知 ,8 表 示 价 格 
上 涨 1 个 单位 时 (下 一 时 段 ) 供 应 量 的 增加 . 所 以 a 反映 消费 者 需求 的 敏感 程度 ,如 果 是 生 
活 必 和 需 品 ,消费 者 处 于 持 币 待 购 状 态 ,商品 数量 稍 缺 ,人 们 立即 蜂拥 抢购 ,a 就 会 较 大 ; 反 
之 , 若 消费 者 购物 心理 稳定 , 则 x 较 小 .8 的 数值 反映 生产 经 营 者 对 价格 的 敏感 程度 ,如 果 
他 们 目光 短 浅 ,热衷 于 追逐 一 时 的 高 利润 ,价格 稍 有 上 涨 就 大 量 增 加 生产 ,8 就 会 较 大 ; 反 
之 ,车 他 们 素质 较 高 ,有 长 远 的 计划 , 则 8 较 小 .定量 分 析 的 结果 (8) 式 表明 , 当 a,8 的 乘积 
小 于 1 时 ,Po 是 稳定 平衡 点 ,商品 数量 和 价格 的 振荡 会 趋向 平稳 . 

政府 的 干预 基于 上 述 分 析 可 以 看 出 , 当 经 济 趋向 不 稳定 时 政府 有 两 种 干预 办 法 . 

一 种 办 法 是 使 a 尽量 小 ,不 妨 考 察 其 极端 情况 a 二 0, 即 需求 直线 f 变 为 水 平 , 这 时 不 
管 供应 函数 如 何 , 即 不 管 8 多 大 ,(8) 式 恒 成 立 , 经 济 总 是 稳定 的 . 实际 上 这 种 办 法 相当 于 
政府 控制 价格 ,无 论 商 品 上 市 量 有 多少 ,命令 价格 yo 不 得 改变 (图 1.7(a)). 

另 一 种 办 法 是 使 8 尽量 小 ,极端 情况 是 6 一 0, 即 供应 直线 g 变 为 竖 直 ,于 是 不 管 需 求 
函数 如 何 , 即 不 管 v 多 大 , (8) 式 恒 成 立 ,经 济 稳定 . 实际 上 这 相当 于 政府 控制 商品 的 上 市 
数量 , 当 供应 量 少 于 需求 时 ,从 外 地 收购 ,投入 市 场 ;而 当 供过于求 时 ,收购 过 剩 部 分 ,维持 
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上 市 量 zx。 不 变 (图 1. 7(b)). 当然 这 种 办 法 需要 政府 具有 相当 的 经 济 实力 . 


OO Xo Xx OO Xo x 


(a) 需求 直线 水 平 ， 经 济 稳定 (b) 供应 直线 竖 直 ， 经 济 稳定 


1.2.3 汽车 三 生产 计划 


问题 ” 某 汽 车 厂 生产 小 .中 .大 3 种 类 型 的 汽车 ,已 知 生 产 各 种 类 型 每 辆 汽车 需要 的 
钢材 .劳动 时 间 以 及 获得 的 利润 如 表 1. 3, 目前 汽车 厂 每 月 钢材 的 供应 量 为 600t, 每 月 总 ， 
的 劳动 时 间 为 60000h, 试 为 该 厂 制订 月 生产 计划 ,使 得 利润 最 大 . 进一步 研究 以 下 问题 : 
由 于 各 种 条 件 限 制 , 如 果 生 产 某 一 类 型 汽车 , 则 至 少 要 生产 80 辆 ,那么 最 优 的 生产 计划 应 
作 何 改变 ? 

表 1.3 各 种 类 型 每 辆 汽车 需要 的 钢材 、 劳 动 时 间 及 获得 的 利润 


小 型 | 中 型 大 型 
钢材 /t 1.5 3 5 
劳动 时 间 /h | 280 | 250 | 400 
利润 /万 元 2 3 4 


基本 模型 ”所 谓 月 生产 计划 指 的 是 3 种 类 型 的 汽车 每 月 各 生产 多 少 辆 ,使 利润 最 大 . 
记 每 月 生产 小 、 中 、 大 型 汽车 的 数量 分 别 为 z;，zs，xzs( 非 负 整 数 ), 汽 车 厂 的 月 利润 为 z. 
合理 地 假设 “每 辆 汽车 获得 的 利润 及 对 钢材 .劳动 时 间 的 需求 量 均 不 随 生 产 数 量变 化 ”, 则 
在 钢材 供应 量 和 总 劳动 时 间 的 约束 下 ,以 利润 最 大 为 目标 的 数学 模型 如 下 


max x 二 .27 十 37x2 十 4zs (10) 
s.t. 1.5zl 十 3zs 十 5zs C600, (11) 
280z1 十 250z 十 400z, < 60000， (12) 
Ziyzsyzi 为 非 负 整数 . , (13) 


其 中 x ，zrs ,xs 为 决策 变量 , 式 (10) 为 目标 函数 ,(11) ~(13) 式 为 约束 条 件 , 它 们 是 这 个 
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优化 模型 的 三 要 素 . 

因为 在 目标 函数 (10) 和 约束 条 件 (11),(12) 中 对 于 决策 变量 都 是 线性 的 ,约束 条 件 
(13) 要 求 决策 变量 为 整数 ,所 以 这 个 模型 称 为 整数 线性 规划 . 

模型 求解 ”虽然 整数 线性 规划 有 多 种 解法 ,但 是 当 决策 变量 和 约束 条 件 比 较 多 时 , 手 
工 计算 是 很 困难 的 ,可 以 利用 现成 的 数学 软件 求解 . 这 个 县 体 问 题 的 解决 办 法 大 体 上 有 以 
下 两 种 : 

第 一 种 办 法 是 将 约束 条 件 (13) 放 松 为 “ 非 负 实数 ”, 模 型 化 为 简单 的 线性 规划 . 很 多 软 
件 如 MATLAB,LINDO 都 可 以 方便 地 求解 线性 规划 ,其 解法 及 软件 实现 将 在 实验 8 中 
介绍 . 这 里 只 给 出 结果 为 zi 一 64.52，z? 一 167.74，z3 一 0,z 一 632. 26. 

为 了 得 到 zx;， zs， zs 的 整数 解 ,可 以 在 上 面 这 个 实数 解 的 附近 试探 : 如 取 xz) 一 65， 
zz 一 167;z 一 64,z: 一 168; 等 .注意 : 必须 在 满足 约束 条 件 (11),(12) 的 前 提 下 ,对 各 种 试 
探 通过 计算 并 比较 目标 函数 值 z 的 大 小 ,得 到 模型 (10) ~(13) 的 解 . 这 个 问题 的 结果 是 
Zz1=64, xs—=168, zi—=0,z=632. 

第 二 种 办 法 是 用 可 以 直接 求解 整数 线性 规划 的 软件 ,如 LINDO, 其 解法 及 软件 实现 
将 在 实验 9 中 介绍 ,会 得 到 与 上 面相 同 的 结果 . : 

虽然 看 起 来 第 二 种 办 法 更 方便 ,但 是 由 于 求解 整数 线性 规划 的 复杂 程度 比 线 性 规划 
大 得 多 ,因而 用 普通 软件 能 求解 的 整数 线性 规划 的 规模 常常 受到 限制 

进一步 研究 的 问题 ”对 于 提出 的 “如 果 生 产 某 一 类 型 汽车 , 则 至 少 要 生产 80 辆 ”的 限 
制 , 上 面 得 到 的 最 优 解 显然 不 满足 这 个 条 件 . 这 种 类 型 的 要 求 是 实际 生产 中 经 常 提出 的 . 
这 个 问题 的 模型 应 将 上 面 的 (13) 式 改 为 

zlyziyz 一 0 或 之 80. (14) 
一 般 的 解法 不 能 直接 考虑 这 样 的 约束 ,(14) 式 也 无 法 输入 数学 软件 . 
解决 这 类 问题 的 办 法 大 体 上 有 以 下 三 种 : 
第 一 种 办 法 ”分解 为 多 个 线性 规划 子 模型 . (14) 式 可 分 解 为 8 种 情况 : 


Tl 一 0， Z2 一 0， Ta 之 80; (14. 1) 
zi 一 0， zi 之 80， zz 二 0; (14. 2) 
Zl 一 0， Za 之 80， Xs 之 80; (14. 3) 
X80， z=0,， z=0; (14. 4) 
XI1 宇 80，Xi 宇 80， Xs 二 0; (14. 5) 
T2280 z=0, zx > 80; | (14. 6) 
zl 之 80， 阅 之 80， Xi 之 80; (14.7) 
C0; (14.8) 


(14. 8) 式 显然 不 可 能 是 问题 的 解 . 可 以 检查 , (14. 3) 式 和 (14. 7) 式 不 满足 约束 条 件 (11)， 
也 不 可 能 是 问题 的 解 . 对 其 他 5 个 线性 规划 子 模型 逐一 求解 ,比较 目标 函数 值 , 可 知 最 优 
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解 在 (14.5) 式 情形 得 到 : x 二 80,zz = 150.4,zs 一 0,z 一 611. 2. 再 像 前 面 一 样 考虑 整数 
约束 可 得 最 后 结果 为 zi 一 80,z?* 王 150,zs 一 0,z 一 610. 

第 二 种 办 法 引入 3 个 0-1 变量 . 设 六 只 取 0, 1 两 个 值 , 则 (14) 式 的 zi 二 0 或 宇 80 
等 价 于 | 


TCMy, zi 宕 80%, yy € (0,1}, (15. 1) 
其 中 M 为 相当 大 的 正 数 ,这 里 可 取 1000( 因 为 zx 不 可 能 超过 1000). 类 似 地 有 

Ts Mys, Tr 80y, vy € {0,1}; (15. 2) 

zs 魏 My，z 之 80y ys € {0,1); (15.3) 


于 是 (10) 一 (12) 式 ,(15.1) 一 (15. 3) 式 构成 一 个 既 有 一 般 的 整数 变量 ,又 有 0-1 变量 的 整 
数 规划 模型 ,也 可 以 用 LINDO 直接 求解 ,结果 与 第 一 种 办 法 相同 . 
第 三 种 办 法 ”化 为 非 线 性 规划 . 条 件 (14) 又 可 表示 为 


Zi 一 80) 之 0， zl 之 0; (16.1) 
Xs (zz 一 80) 之 0， 之 2 之 0; (16. 2) 
az 一 80) 之 0 x 0, C16; 3) 


式 子 左 端 是 决策 变量 的 非 线性 函数 ,(10) 一 (13) 式 (16.1) 一 (16.3) 式 构成 的 模型 称 为 非 
线性 规划 . 非 线 性 规划 也 可 以 用 数学 软件 求解 , 如 LINGO 能 解 整数 非 线性 规划 ， 
MATLAB 只 能 解 ( 实 数 ) 非 线性 规划 ,其 解法 及 软件 实现 将 在 实验 7. 中 介绍 ,但 是 结果 常 
依赖 于 初 值 的 选择 ,无 法 保证 得 到 的 是 全 局 最 优 解 , 通常 尽量 不 用 非 线性 规划 模型 . 


1.2.4 人 口 预报 


人 类 社会 进入 20 世纪 以 来 ,在 科学 技术 和 和 生产力 飞 速 发 展 的 同时 ,世界 人 口 也 以 空 
前 的 规模 增长 ,统计 数据 如 表 1. 4: 


表 1.4 世界 人 口 
年 1625 1830 1930 1960 1974 1987 | 1999 
人 口 / 亿 | 5 10 20 30 40 50 60 


可 以 看 出 ,人 口 每 增加 10 亿 的 时 间 , 由 一 百年 缩短 为 十 二 三 年 . 我 们 赖 以 生存 的 地 球 ,已 
经 携带 着 它 的 60 亿 子 民 踏 入 21 世纪 . 

长 期 以 来 ,人 类 的 繁殖 一 直 在 自发 地 进行 着 .只 是 由 于 人 口 数量 的 迅速 膨胀 和 环境 质 
量 的 急剧 恶化 ,人 们 才 猛 然 醒悟 ,开始 研究 人 类 和 自然 的 关系 、 人 口 数 量 的 变化 规律 ,以 及 
如 何 进 行人 口 控制 等 问题 . 

我 国 是 世界 第 一 人 口 大 国 ,地 球 上 每 5 个 人 中 就 有 1 个 中 国人 .在 20 世纪 的 一 段 时 


EE 
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间 内 我 国人 口 的 增长 速度 过 快 , 见 表 1. 53:; 
表 1.5 中 国人 口 


有 效 地 控制 我 国人 口 的 增长 ,不 仅 是 使 我 国 全 面 进入 小 康 社会 ,到 21 世纪 中 叶 建 成 富强 
民主 文明 的 社会 主义 国家 的 需要 ,而 且 对 于 全 人 类 社会 的 美好 理想 来 说 ,也 是 我 们 义 不 容 
辞 的 责任 . 

认识 人 口 数 量 的 变化 规律 ,做 出 较 准 确 的 人 口 预报 , 逢 有 效 控制 人 口 增长 的 前 提 . 长 
期 以 来 人 们 在 这 方面 做 了 不 少 工作 ,建立 了 各 种 形式 的 人 口 模型 ,下 面 介绍 其 中 最 基本 的 
两 种 . 

1. 指数 增长 模型 

记 今 年 人 口 为 zo 光 年 后 人 口 为 zi, 年 增长 率 为 >, 人 们 常用 的 计算 公式 是 

zk 一 Xo(1 十 7)*. (17) 

显然 ,(17) 式 成 立 的 基本 条 件 是 7 保持 不 变 . 

二 百 多 年 前 英国 人 口 学 家 马尔 萨 斯 (Malthus, 1766 一 1834) 调 查 了 英国 一 百 多 年 的 
人 口 统计 资料 ,得 出 了 人 口 增长 率 不 变 的 假设 ,并 据 此 建立 了 下 面 的 模型 . 

模型 建立 ” 记 时 刻 1 的 人 口 为 x (1), 当 考察 一 个 国家 或 一 个 较 大 地 区 的 人 口 时 ,xz(1) 
是 一 个 很 大 的 整数 .为 了 利用 微 积 分 这 一 数学 工具 ,将 x(1) 视 为 连续 、 可 微 函 数 . 记 初 始 
时 刻 (t 二 0) 的 人 口 为 xo. 假设 和 人口 增长 率 为 常数 x, 即 单位 时 间 内 zx(z) 的 增 量 等 于 ~ 乘 以 
X(t). 考虑 t 到 :十 At 时 间 内 人 口 的 增 量 ,显然 有 

X(t At)— z(t) 一 TCDAL 

令 At 一 0, 得 到 zx(z) 满足 微分 方程 


中 三 并 
dt | , (18) 
Z(0) = Zo， 
由 这 个 方程 很 容易 解 出 
X(t) = Zoer (19) 


r 之 0 时 ,(19) 式 表示 人 口 将 按 指数 规律 随时 间 无 限 增长 , 称 为 指数 增长 模型 ， 
思考 ”说 明 我 们 常用 的 预报 公式 (17? 就 是 指数 增长 模型 (19) 的 离散 近似 形式 . 
参数 合计 用 模型 (19) 作 人 口 预报 必须 知道 参数 r 和 xz。 ,确定 参数 的 一 个 办 法 是 利 
用 实际 数据 作 拟 合 . 为 了 利用 实验 5 中 介绍 的 算法 及 软件 , 需 将 (19) 式 取 对 数 , 得 


@ 1953 一 2000 年 的 数据 来 自 第 一 次 至 第 五 次 全 国人 口 普 查 资 料 . 
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y= 二 a, y= lnr, a = lnzo. (20) 
以 美国 人 口 实际 数据 为 例 ( 见 表 1.6 第 1,2 列 ), 对 (20) 式 作 数 据 拟 合 ,如 用 1790 年 
至 1900 年 的 数据 ,得 到 = 二 0. 2743/10 年 ,zo 二 4. 1884; 如 用 全 部 数据 (1790 年 至 2000 
年 ) 得 到 7 二 0.2022/(10 年 ) ,zo 一 6.0450. 也 可 以 在 式 (20) 中 令 zo 二 3.9(1790 年 实际 人 
口 ) ,只 计算 ~. 
用 得 到 的 > 和 ze 代入 (19) 式 ,将 计算 结果 与 实际 数据 作 比 较 . 表 1.6 中 计算 人 口 x 
是 用 1790 年 至 1900 年 数据 拟 合 的 结果 ,zs 是 用 全 部 数据 拟 合 的 结果 ,图 1. 8 是 它们 的 
图 形 表 示 ( 十 号 是 实际 数据 ,曲线 是 计算 结果 ). 


表 1.6 指数 增长 模型 和 阻 滞 增 长 模型 对 美国 人 口 数据 拟 合 的 结果 


升 算 人 口 以 / 百 太 | 于 算 人 口 避 / 百 万 | 计算 人 口 2/ 译 方 
(指数 增长 模型 ) (指数 增长 模型 ) ( 阻 浪 增 长 模型 
1790 3. 9 4. 2 6.0 3.9 


1800 5.3 5. 9 7.4 5.0 


年 实际 人 口 / 百 万 
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(a) 1790 年 至 1900 年 (b) 1790 年 至 2000 年 


图 1.8 用 指数 增长 模型 拟 合 美国 人 口 数据 


结果 分 析 ”可 以 看 出 ,指数 增长 模型 基本 上 能 够 描述 19 世纪 以 前 美国 人 口 的 增长 ， 
但 是 进入 20 世纪 后 ,美国 人 口 增长 明显 变 慢 ,这 个 模型 就 不 合适 了 . 

历史 上 ,指数 增长 模型 与 19 世纪 以 前 欧洲 一 些 地 区 人 口 统计 数据 可 以 很 好 地 吻合 ， 
迁 往 加 拿 大 的 欧洲 移民 后 代 人 口 也 大 致 符合 这 个 模型 .另外 ,用 它 作 短期 人 口 预测 可 以 得 
到 较 好 的 结果 . 显然 ,这 是 因为 在 这 些 情况 下 ,模型 的 基本 假设 一 一 人 口 增长 率 是 常数 ,大 
致 成 立 . 

但 是 长 期 来 看 ,任何 地 区 的 人 口 都 不 可 能 无 限 增长 , 即 指数 模型 不 能 描述 ,也 不 能 预 
测 较 长 时 期 的 人 口 演变 过 程 . 这 是 因为 ,人 口 增长 率 事实 上 是 在 不 断 地 变化 着 . 排除 灾难 、 
战争 等 特殊 时 期 ,一般 说 来 , 当 人 口 较 少 时 ,增长 较 快 , 即 增长 率 较 大 ;人 口 增加 到 一 定数 
量 以 后 ,增长 就 会 慢 下 来 , 即 增长 率 变 小 ， 

为 了 使 人 口 预报 特别 是 长 期 预报 更 好 地 符合 实际 情况 ,必须 修改 指数 增长 模型 关于 
人 口 增长 率 是 常数 这 个 基本 假设 . 

2 阻 潍 增 长 模型 (Logistic 模型 ) 

模型 建立 ”分 析 人 口 增长 到 一 定数 量 后 增长 率 下 降 的 主要 原因 ,人 们 注意 到 ,自然 次 
源 、 环 境 条 件 等 因素 对 人 口 的 增长 起 着 阻 滞 作 用 ,并 且 随 着 人 口 的 增加 , 阻 滞 作 用 越 来 
越 大 . 
阻 滞 作 用 体现 在 对 人 口 增长 率 ~ 的 影响 上 ,使 得 > 随 着 人 口 数 量 z 的 增加 而 下 降 . 车 
将 -表示 为 z 的 函数 r~(z), 则 它 应 是 减 函 数 . 于 是 方程 (18) 改 为 


0 (21) 
[0) = Zo， 
对 r(x) 的 一 个 最 简单 的 假定 是 , 设 r(x) 为 工 的 线性 函数 , 即 
(wir TO (22) 


这 里 7 称 固 有 增长 率 , 表 示人 口 很 少时 (理论 上 是 zx 一 0) 的 增长 率 . 为 了 确定 系数 * 的 意 
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义 , 引 入 自然 资源 和 环境 条 件 所 能 容纳 的 最 大 人 口 数量 zx, , 称 人 口 容 量 . 当 z 一 zw 时 人 
口 不 再 增长 , 即 增长 率 ~(zw) 王 0, 代 人 (22) 式 得 s 二 r/zs, 于 是 rz) 二 r(1 一 zx/z,), 将 它 


代入 方程 (21) 得 
dz 并 
三 | 
b z( (23) 


xX(0) = zo. , 
方程 (23) 右 端的 因子 rz 体现 人 口 自身 的 增长 趋势 ,因子 (1 一 z/zw) 则 体现 了 资源 和 环境 
对 人 口 增长 的 阻 滞 作 用 ,这 个 模型 称 为 阻 滞 增 长 模型 . 

如 果 以 为 横 轴 ，dz/d 为 纵 轴 作出 方程 (23) 的 图 形 ( 图 1. 9(a)), 可 以 看 出 ,人 口 增 
长 速度 dz/di 随 着 xz 的 增加 而 变化 的 情况 . 请 读者 由 此 分 析 z(t) 的 变化 过 程 ,大 致 画 出 
z(t) 的 图 形 . 

方程 (23) 可 以 用 分 离 变 量 法 求解 得 到 


z(t) = > (24) 


读者 可 以 用 计算 机 画 出 (24) 式 的 图 形 , 它 是 一 条 S 形 曲线 (图 1.9(b)),z 增加 得 先 快 后 
慢 ,t>~co 时 zz， 拐点 在 工 一 zw/2.〈 上 面 你 大 致 天 出 的 图 形 与 这 个 图 形 一 样 吗 ?) 


0.25 | 
0.20 | 

1 
0.15 | 
0.10 ' 
0.05 | 

上 上 上 
0 0.2 0.4 0.6 0.8 1.0 
(a) dx/df ~ x 曲线 (b) x~t 曲 线 
(=1, x =1) (一 1 xm=1, xo=0.1) 


图 1.9 ”Logistic 模型 曲线 


参数 估计 为 了 利用 实验 5 中 介绍 的 算法 及 软件 ,估计 这 个 模型 的 参数 > 和 工 ,, ,我 

们 不 用 (24) 式 ,而 将 方程 (23) 表 示 为 
i 
(25) 式 左 端 可 以 从 表 1.6 的 实际 人 口 数 据 用 数值 微分 ( 见 实 验 2) 算 出 , 右 端 对 参数 r,s 是 
线性 的 .利用 1860 年 至 1990 年 的 数据 (去 掉 个 别 蜡 常数 据 ) 计 算得 到 r= 二 0. 2557/(10 


(25) 
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年 ) ,zw 一 392.0886. 用 上 面 得 到 的 参数 ”和 xz 代入 (24) 式 ,计算 结果 见 表 1.6 最 后 一 列 
和 图 1. 10. 

可 以 看 出 ,用 这 个 模型 拟 合 时 虽然 中 间 
一 段 (19 世纪 中 叶 到 20 让 纪 中 时) 不 大 好 ,但 
是 最 后 一 段 (20 世纪 中 时 以 后 ) 吻 合 得 不 错 . 

模型 检验 ”在 估计 阻 滞 增 长 模型 的 参数 
时 没有 用 2000 年 的 实际 数据 ,是 为 了 用 它 作 
模型 检验 . 我 们 用 模型 计算 2000 年 的 人 口 ， 
与 已 知 的 实际 数据 (281. 4 百 万 ) 比 较 , 来 检验 


模型 是 否 合适 . 图 1.10 阻 滞 增 长 模型 拟 合 美国 人 口 数据 
为 简单 起 见 , 可 利用 x 《1990) 和 方程 《1790 年 为 起 点 ) 
(23) 做 如 下 计算 : 


xX (2000) = x (1990) 十 Az 一 工 (1990) 十 rZ 工 (1990)[1 一 过 (1990)/z。] 

得 到 z(2000) = 274.5《〈 百 万 ) ,与 实际 数据 的 误差 约 2.5%%, 可 以 认为 该 模型 是 相当 满 
意 的 . ; 
人 口 预报 ”应 将 2000 年 的 实际 数据 加 进去 重新 估计 参数 ,可 得 "一 0. 2490/(10 年 )， 
Zr 一 433.9886. 然后 再 用 模型 检验 中 的 计算 方法 预报 美国 2010 年 的 人 口 ,得 到 x (2010) 王 
306.0〈 百 万 ). 这 个 预报 结果 的 准确 性 如 何 , 让 我 们 拭目以待 . 

由 方程 (23) 表 示 的 阻 灌 增 长 模型 ,是 荷兰 生物 数学 家 Verhulst 于 19 世纪 中 叶 提 出 
的 . 它 不 仅 能 够 大 体 上 描述 人 口 及 许多 物种 数量 (如 森林 中 的 树木 、. 鱼 塘 中 的 鱼 群 等 ?的 变 
化 规律 ,而 且 在 社会 经 济 领 域 也 有 广泛 的 应 用 ,例如 耐用 消费 品 的 售 量 就 可 以 用 它 来 描 
述 . 人 们 常 称 这 个 模型 为 Logistic 模型 . , 

通过 上 面 4 个 例题 可 以 看 到 实际 问题 建立 数学 模型 的 过 程 ,同时 也 体现 出 数学 实验 
在 建 模 过 程 中 的 应 用 : 例 1. 2. 3 模型 的 求解 要 依靠 计算 机 和 数学 软件 , 例 1. 2. 1 和 例 
1. 2. 4 中 用 软件 作 的 参数 估计 则 直接 是 建 模 的 一 部 分 . 


1.3 ”数学 建 模 的 基本 方法 和 步骤 以 及 重要 意 X 


数学 建 模 面临 的 实际 问题 多 种 多 样 , 建 模 的 目的 不 同 , 分 析 的 方法 不 同 ,采用 的 数学 
工具 不 同 , 所 得 模型 的 类 型 也 不 同 .我 们 不 能 指望 归纳 出 大 于 条 准则 ,适用 于 一 切实 际 问 
题 的 数学 建 模 .下面 所 谓 基 本 方法 不 是 针对 具体 问题 而 是 从 方法 论 的 意义 上 讲 的 . 


1.3.1 数学 建 模 的 基本 方法 
一 般 说 来 ,数学 建 模 方法 大 体 上 可 分 为 机 理 分 析 和 测试 分 析 两 种 . 机 理 分 析 是 根据 对 
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客观 事物 特性 的 认识 , 找 出 反映 内 部 机 理 的 数量 规律 ,建立 的 模型 常 有 明确 的 物理 意义 或 
其 他 实际 意义 . 1.2 节 的 几 个 实例 主要 用 的 是 机 理 分 析 . 测试 分 析 将 研究 对 象 看 作 一 个 
“黑箱 ”系统 (意思 是 它 的 内 部 机 理 看 不 清楚 ) ,通过 对 系统 输入 、 输 出 数据 的 测量 和 统计 分 
析 , 按 照 一 定 的 准则 找 出 与 数据 拟 合 得 最 好 的 模型 . 

面 对 一 个 实际 问题 用 哪 一 种 方法 建 模 ,主要 取决 于 人 们 对 研究 对 象 的 了 解 程度 和 建 
模 目 的 . 如 果 和 掌握 了 一 些 内 部 机 理 的 知识 ,模型 也 要 求 具 有 有 反映 内 在 特征 的 物理 意义 , 建 
模 就 应 以 机 理 分 析 为 主 . 而 如 果 对 象 的 内 部 规律 基本 上 不 清楚 ,模型 也 不 需要 反映 内 部 特 
性 (例如 仅 用 于 对 输出 作 预 报 ) ,那么 就 可 以 用 测试 分 析 . 对 于 许多 实际 问题 也 常常 将 两 种 
方法 结合 起 来 ,用 机 理 分 析 建 立 模型 的 结构 ,用 测试 分 析 确 定 模 型 的 参数 ,1. 2. 1 节 中 的 
汽车 刹车 距离 就 是 这 种 情况 . 

机 理 分 析 当 然 要 针对 具体 问题 来 做 ,不 可 能 有 统一 的 方法 ,因而 主要 是 通过 实例 研究 
(case studies) 来 学 习 .测试 分 析 有 一 套 完整 的 数学 方法 ,以 后 的 实验 中 我 们 将 学 习 的 最 
小 二 乘法 .回归 分 析 等 是 其 中 的 一 小 部 分 . 以 动态 系统 为 主 的 测试 分 析 称 为 系统 辨识 
(system identification) ， 是 一 支 专门 学 科 . 本 书 以 后 所 说 的 数学 建 模 主要 指 机 理 分 析 . 


1.3.2 数学 建 模 的 一 般 步骤 


建 模 要 经 过 哪些 步骤 并 没有 一 定 的 模式 ,通常 与 问题 性 质 、 建 模 目的 等 有 关 . 下 面 介 
绍 的 是 机 理 分 析 方 法 建 模 的 一 般 过 程 , 如 图 1. 11 所 示 . 


模型 准备 模型 假设 模型 构成 
一 ”二 一 

模型 检验 [| 模型 分 析 模型 求解 
模型 应 用 


图 1.11 数学 建 模 步骤 示意 图 


模型 准备 ”了 解 问题 的 实际 背景 ,明确 建 模 目 的 ,搜集 必要 的 信息 如 现象 .数据 等 , 尽 
量 弄 清 对 象 的 主要 特征 ,形成 一 个 比较 清晰 的 “问题 ”由 此 初步 确定 用 哪 一 类 模型 . 情况 
明 才 能 方法 对 . 在 模型 准备 阶段 要 深入 调查 研究 ,虚心 向 实际 工作 者 请 教 ,尽量 掌握 第 一 
手 资料 . 

模型 假设 “根据 对 象 的 特征 和 建 模 目 的 , 抓 住 问题 的 本 质 ,忽略 次 要 因素 ,做 出 必要 
的 .合理 的 简化 假设 . 对 于 建 模 的 成 败 这 是 非常 重要 和 困难 的 一 步 . 假设 做 得 不 合理 或 太 
简单 ,会 导致 错误 的 或 无 用 的 模型 ;假设 做 得 过 分 详细 ,试图 把 复杂 对 象 的 众多 因素 都 考 
虑 进去 ,会 很 难 或 无 法 继续 下 一 步 的 工作 .常常 需要 在 合理 与 简化 之 间 做 出 恰当 的 折衷， 
通常 ,作假 设 的 依据 ,一 是 出 于 对 问题 内 在 规律 的 认识 ,二 是 来 自 对 现象 数据 的 分 析 , 以 
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及 二 者 的 综合 . 想像 力 .洞察 力 、 判 断 力 和 经 验 , 在 模型 假设 中 起 着 重要 作用 . 

模型 构成 ”根据 所 作 的 假设 ,用 数学 的 语言 .符号 描述 对 象 的 内 在 规律 ,建立 包含 常 
量 、 变 量 等 的 数学 模型 ,如 优化 模型 微分 方程 模型 .差分 方程 模型 .图 的 模型 等 . 这 里 除了 
需要 一 些 相关 学 科 的 专门 知识 外 ,还 常常 需要 较为 广阔 的 应 用 数学 方面 的 知识 . 要 善于 发 
挥 想像 力 , 注 意 使 用 类 比 法 ,分 析 对 象 与 熟悉 的 其 他 对 象 的 共性 ,借用 已 有 的 模型 . 建 模 时 
还 应 遵循 的 一 个 原则 是 ,尽量 采用 简单 的 数学 工具 ,因为 所 建 模型 总 是 希望 更 多 的 人 了 解 
和 使 用 ,而 不 是 只 供 少 数 专家 欣赏 . 

模型 求解 ”可 以 采用 解 方程 . 画 贺 形 、 优 化 方法 数值 计算 、 统 计 分 析 等 各 种 数学 方 
法 ,特别 是 数学 软件 和 计算 机 技术 . 

模型 分 析 ”对 求解 结果 进行 数学 上 的 分 析 , 如 结果 的 误差 分 析 , 模 型 对 数据 的 灵敏 性 
分 析 、 对 假设 的 强健 性 分 析 等 

模型 检验 ”把 求解 和 分 析 结 果 翻 译 回 到 实际 问题 ,与 实际 的 现象 .数据 比较 ,检验 模 
型 的 合理 性 和 适用 性 . 如 果 结 果 与 实际 不 符 , 间 题 常常 出 在 模型 假设 上 ,应 该 修改 .补充 假 
设 ,重新 建 模 ,如 图 1.11 中 的 虚线 所 示 . 这 一 步 对 于 模型 是 否 真 的 有 用 非常 关键 ,要 以 严 
- 肃 认真 的 态度 对 待 . 有 些 模 型 要 经 过 几 次 反复 ,不 断 完善 ,直到 检验 结果 获得 某 种 程度 上 
的 满意 . . | 
模型 应 用 ”应 用 的 方式 与 问题 性 质 、 建 模 目 的 及 最 终 的 结果 有 关 , 一 般 不 属于 本 书 讨 
论 的 范围 . 

应 当 指 出 ,并 不 是 所 有 问题 的 建 模 都 要 经 过 这 些 步 又 ,有 时 各 步骤 之 间 的 界限 也 不 那 
么 分 明 , 建 模 时 不 要 拘泥 于 形式 上 的 按部就班 ,本 书 的 实例 就 采取 了 灵活 的 表述 形式 . 

有 人 认为 ,目前 数学 建 模 与 其 说 是 一 门 技 术 , 不 如 说 是 一 门 艺术 . 与 一 种 技术 大 致 上 
有 章 可 循 不 同 , 艺 术 在 某 种 意义 下 无 法 归纳 出 若干 条 普遍 适用 的 准则 . 一 名 出 色 的 艺术 家 
需要 大 量 的 观摩 和 前 辈 的 指教 ,更 需要 亲身 的 实践 .类 似 地 ,掌握 建 模 这 门 艺术 ,培养 想像 
力 和 洞察 力 ,一 要 学 习 、 分 析 、 评 价 、 改 进 别 人 做 过 的 模型 ;二 要 亲自 动手 ,认真 做 几 个 实际 
题目 . 作为 数学 实验 课程 的 教材 ,我 们 在 每 个 实验 中 都 给 出 若干 经 过 简化 的 实际 问题 ,用 
作 建 模 练习 . 希望 阅读 更 多 建 模 示例 的 读者 ,可 以 参考 众多 的 数学 模型 书籍 , 如 参考 文 
献 [FL 一 8], 


1.3.3 数学 建 模 的 重要 意义 


进入 20 世纪 以 来 , 随 着 数学 以 空前 的 广度 和 深度 向 一 切 领域 的 渗透 ,和 电子 计算 机 
的 出 现 We 
现实 世界 中 的 重要 意义 . 

(1) 在 一 般 工 程 技 术 领 域 ,数学 建 模 仍然 大 有 用 武之 地 . 

在 以 声 . 光 .热力 . 电 这 些 物理 学 科 为 基础 的 诸如 机 械 . 电 机 、 土 木 .水 利 等 工程 技术 


人 
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领域 中 ,数学 建 模 的 普遍 性 和 重要 性 不 言 而 喻 . 虽然 这 里 的 基本 模型 是 已 有 的 ,但 是 由 于 
新 技术 、 新 工艺 的 不 断 涌现 ,提出 了 许多 需要 用 数学 方法 解决 的 新 问题 ;高 速 . 大 型 计算 机 
的 飞速 发 展 ,使 得 过 去 即便 有 了 数学 模型 也 无 法 求解 的 课题 (如 大 型 水 坝 的 应 力 计算 等 ) 
迎刃而解 ;建立 在 数学 模型 和 计算 机 模拟 基础 上 的 CAD 技术 ,以 其 快速 .经 济 、 方 便 等 优 
势 ,大 量 地 替代 了 传统 工程 设计 中 的 现场 实验 、 物 理 模拟 等 手段 . 

(2) 在 高 新 技术 领域 ,数学 建 模 几 乎 是 必 不 可 少 的 工具 . 有 

无 论 是 发 展 通信 、 航 天 、 微 电子 、 自 动 化 等 高 新 技术 本 身 ,还 是 将 高 新 技术 用 于 传统 工 
业 去 创造 新 工艺 、 开 发 新 产品 ,计算 机 技术 支持 下 的 建 模 和 模拟 都 是 经 常 使 用 的 有 效 手 
段 . 数学 建 模 、 数 值 计 算 和 计算 机 图 形 学 等 相 结合 形成 的 计算 机 软件 ,已 经 被 固化 于 产品 
中 ,在 许多 高 新 技术 领域 起 着 核心 作用 ,被 认为 是 高 新 技术 的 特征 之 一 . 在 这 个 意义 上 , 数 
学 不 再 仅仅 作为 一 门 科学 ,是 许多 技术 的 基础 ,而 且 直 接 走向 了 技术 的 前 台 . 国际 上 一 些 
学 者 提出 了 “高 技术 本 质 上 是 一 种 数学 技术 ”的 观点 . 

(3) 数学 迅速 进入 一 些 新 领域 ,为 数学 建 模 开 拓 了 许多 新 的 处 女 地 . 

” 随 着 数学 向 诸如 经 济 、 人 口 .生态 、 地 质 等 所 谓 非 物理 领域 的 渗透 ,一 些 交叉 学 科 如 计 
量 经 济 学 、 人 口 控 制 论 .数学 生态 学 、 数 学 地 质 学 等 应 运 而 生 . 这 里 一 般 地 说 不 存在 作为 支 
配 关系 的 物理 定律 , 当 用 数学 方法 研究 这 些 领域 中 的 定量 关系 时 ,数学 建 模 就 成 为 首要 
的 .关键 的 步 又 和 这 些 学 科 发 展 与 应 用 的 基础 . 在 这 些 领 域 里 建立 不 同类 型 不同 方法、 不 
同 深浅 程度 模型 的 余地 相当 大 ,为 数学 建 模 提供 了 广阔 的 新 天 地 . 马克 思 说 过 :“ 一 门 科 
学 只 有 成 功 地 运用 数学 时 , 才 算 达到 了 完善 的 地 步 ”. 展望 21 世纪 ,数学 必 将 大 踏步 地 进 
入 所 有 学 科 , 数 学 建 模 将 迎 来 蓬勃 发 展 的 新 时 期 . 

今天 ,在 国民 经 济 和 社会 活动 的 以 下 诸多 方面 ,数学 建 模 都 有 着 非常 具体 的 应 用 . 

分 析 与 设计 例如 描述 药物 浓度 在 人 体内 的 变化 规律 以 分 析 药 物 的 疗效 ;建立 跨 音 
速 流 和 激 波 的 数学 模型 ,用 数值 模拟 设计 新 的 飞机 杜 型 ， 

预报 与 决策 生产 过 程 中 产品 质量 指标 的 预报 ,气象 预报 ,人 口 预 报 , 经 济 增长 预报 
等 ,都 要 有 预报 模型 ;使 经 济 效益 最 大 的 价格 策略 ,使 费用 最 少 的 设备 维修 方案 ,是 决策 模 
型 的 例子 . 、 
”控制 与 优化 ”电力 、 化 工 生产 过 程 的 最 优 控制 ,零件 设计 中 的 参数 优化 ,要 以 数学 模 
型 为 前 提 . 建立 大 系统 控制 与 优化 的 数学 模型 ,是 迫切 需要 和 十 分 棘手 的 课题 . 

规划 与 管理 ”生产 计划 资源 配置 .运输 网 络 规划 、 水 库 优化 调度 ,以 及 排队 策略 、 物 
资 管理 等 ,都 可 以 用 运筹 学 模型 解决 . 

数学 建 模 与 计算 机 技术 的 关系 密 不 可 分 . 一 方面 , 像 新 型 飞机 设计 、 石 油 勘 探 数据 处 
理 中 数学 模型 的 求解 当然 离 不 开 巨 型 计算 机 ,而 个 人 计算 机 的 普及 更 使 数学 建 模 逐 步 进 
入 人 们 的 日 常 活 动 . 比如 当 一 位 公司 经 理 根 据 客户 提出 的 产品 数量 、 质 量 、 交 货 期 等 要 求 ， 
用 笔记 本 电脑 与 客户 进行 价格 谈判 时 ,您 不 会 怀疑 他 的 电脑 中 贮存 了 由 公司 的 各 种 资源 、 


1.4 实验 练习 


产品 工艺 流程 及 客户 需求 等 数据 研制 的 数学 模型 一 快速 报价 系统 和 生产 计划 系统 . 另 
一 方面 ,以 数字 化 为 特征 的 信息 正 以 爆炸 之 势 涌 和 人 计算 机 ,去 伪 存 真 .归纳 整理 .分 析 现 
象 . 显 示 结 果 …… 计 算 机 需要 人 们 给 它 以 思维 的 能 力 , 这 些 当 然 要 求助 于 数学 模型 . 所 以 
把 计算 机 技术 与 数学 建 模 在 知识 经 济 中 的 作用 比喻 为 如 虎 添 瑰 ,是 恰如其分 的 . 

美国 科学 院 一 份 报 告 总 结 了 将 数学 科学 转化 为 生产 力 过 程 中 的 成 功 和 失败 ,得 出 了 
“数学 是 一 种 关键 的 .普遍 的 、 可 以 应 用 的 技术 ”的 结论 ,认为 数学 “由 研究 到 工业 领域 的 技 
术 转 化 ,对 加 强 经 济 竞 争 力 具有 重要 意义 ”, 而 “计算 和 建 模 重新 成 为 中 心 课题 ,它们 是 数 
学 科学 技术 转化 的 主要 途径 ”. 


1.4 实验 练习 


实验 目的 ”通过 解决 简化 的 实际 问题 学 习 初 步 的 数学 建 模 方法 ,培养 建 模 意识 . 

实验 内 容 

1， 怎样 解决 下 面 的 实际 问题 ? 包括 需要 哪些 数据 资料 ,要 做 些 什么 观察 .试验 以 及 
建立 什么 样 的 数学 模型 等 

(1) 估计 一 个 人 体内 血液 的 总 量 . 

(2) 为 保险 公司 制定 人 寿 保 险 金 计划 (不 同年 龄 的 人 应 缴纳 的 金额 和 公司 赔偿 的 
金额 ). 

(3) 估计 一 批 日 光 灯 管 的 寿命 

(4) 确定 火箭 发 射 至 最 高 点 所 需 的 时 间 . 

(5) 决定 十 字 路 只 黄 灯亮 的 时 间 长 度 ， 

(6) 为 汽车 租赁 公司 制订 车 辆 维修 ,更 新 和 出 租 计划 . 

(7) 一 高 层 办 公 楼 有 4 部 电梯 ,早晨 上 班 时 间 非 常 拥挤 ,试制 订 合理 的 运行 计划 . 

2. 在 超市 购物 时 你 注意 到 大 包装 商品 比 小 包装 商品 便宜 这 种 现象 了 吗 ? 比如 洁 银 
牙膏 50g 装 的 每 支 1. 50 元 ,120g 装 的 每 支 3. 00 元 ,二 者 单位 重量 的 价格 比 是 1.2 : 1. 试 
构造 模型 解释 这 个 现象 . 

(1) 分 析 商 品 价格 c 与 商品 重量 w 的 关系 . 价格 由 生产 成 本 、 包 装 成 本 和 其 他 成 本 决 
定 , 这 些 成 本 中 有 的 与 重量 ww 成 正比 ,有 的 与 表面 积 成 正比 ,还 有 与 -ww 无 关 的 因素 . 

(2) 给 出 单位 重量 价格 c 与 w 的 关系 , 画 出 它 的 简 图 ,说明 w 越 大 < 越 小 ,但 是 随 着 
w 的 增加 c 减 小 的 程度 变 小 . 解释 实际 意义 是 什么 ， 

3. 利用 表 1. 6 给 出 的 1790 一 2000 年 的 美国 实际 人 口 资 料 建立 下 列 模型 : 

(1) 分 段 的 指数 增长 模型 . 将 时 间 分 为 车 干 段 ,分 别 确定 增长 率 x. 

(2) 阻 滞 增 长 模型 . 换 一 种 方法 确定 固有 增长 率 > 和 最 大 容量 了. 
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实验 1 数学 建 模 初步 


4 说 明 Logistic 模型 (24) 可 表 为 z() 一 了 =a, 其 中 如 是 人 口 增长 出 现 扣 点 的 


时 刻 , 并 给 出 与 r, zx。，zo 的 关系 . 

5. 假定 人 口 的 增长 服从 这 样 的 规律 : 时 刻 t 的 人 口 为 zC2),t 到 i 十 At 时 间 内 人 口 的 
增 量 与 x 一 x(2) 成 正比 (其 中 x, 为 最 大 容量 ). 试 建立 模型 并 求解 . 作出 解 的 图 形 并 与 指 
数 增长 模型 . 阻 灌 增长 模型 的 结果 进行 比较 . . 

6. 一 垂钓 俱乐部 鼓励 垂钓 者 将 钓 上 的 鱼 放生 ,打算 按照 放生 的 鱼 的 重量 给 予 奖 励 . 


惧 乐 部 只 准备 了 一 把 软 尺 用 于 测量 ,请 你 设计 按照 测量 的 长 度 估计 鱼 的 重量 的 方法 . 假 
定 鱼池 中 只 有 一 种 鱼 ( 鲈 鱼 ), 并 且 得 到 8 条 鱼 的 数据 如 表 1.7( 胸 围 指 鱼 身 的 最 大 周 长 ): 
表 1.7 
身长 /cm 36.8 31.8 43.8 36.8 32.1 45. 1 35. 9 32.1 


重量 /g 
胸围 /cm 


用 机 理 分 析 建 立 模型 ,并 试用 数据 确定 参数 . 

7. 要 在 雨中 从 一 处 走 到 另 一 处 , 雨 的 方向 和 大 小 都 不 变 , 试 建立 一 个 模型 讨论 是 否 
走 得 越 快 , 淋 雨 量 越 小 . 设 人 体 为 长 方 柱 , 表 面积 之 比 为 : 前 : 侧 : 顶 二 1 :a:b. 人 沿 工 
方向 以 速度 v 前 进 ,而 雨 速 在 x,y,z 方 向 的 分 量 为 u; ,wy ,wu. 写 出 淋 雨 量 的 表达 式 , 画 出 
淋 雨 量 随 v 变化 的 曲线 ,从 而 确定 在 什么 情况 下 走 得 越 快 , 淋 雨 量 越 小 ,在 什么 情况 下 不 
是 这 样 . 

8. 甲 、 乙 两 公司 通过 广告 来 竞争 销售 商品 的 数量 ,广告 费 分 别 是 工程 y. 设 甲 、. 乙 公 
司 商品 的 售 量 在 两 公司 总 售 量 中 占 的 份额 ,是 它们 的 广告 费 在 总 广告 费 中 所 占 份额 的 函 


数 了 (7 于 5) 和 f( 半 >). 又 设 公司 的 收入 与 售 量 成 正比 ,从 收入 中 扣除 广告 费 后 即 为 公 
司 的 利润. 试 构造 模型 的 图 形 ,并 讨论 甲 公 司 怎样 确定 广告 费 才能 使 利润 最 大 . 
(1) 邻 Wes 册 f( 四 十 f(1 一 小 王 1. 夯 出 f(1) 的 示意 图 . 
(2) 写 出 甲 公司 利润 的 表达 式 p(x). 对 于 一 定 的 y, 使 p(x) 最 大 的 的 最 优 值 应 满 
足 什么 关系 . 用 图 解法 确定 这 个 最 优 什 . 
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差分 方程 和 数值 微分 


差分 方程 是 在 离散 时 段 上 描述 现实 世界 中 变化 过 程 的 数学 模型 ， 试看 两 个 简单 的 
例子 . 
例 1 某 种 货币 1 年 期 存款 的 年 利率 是 ~, 现存 人 M 元 , 问 n 年 后 的 本 金 与 利息 之 和 
(下 称 本 息 ) 是 多 少 ? 
按照 规定 ,存款 1 年 到 期 后 若 不 取出 , 则 银行 自动 将 本 息 一 起 作为 本 金 转 存 1 年 . 记 
第 & 年 的 本 息 为 zx, 则 第 & 十 1 年 的 本 息 应 为 
ri = lr) k= 0 2 (1) 
以 k= 二 0 时 zo 二 M 代 入 ,并 将 (1) 式 递 推 4 次 可 得 nn 年 后 本 息 为 x, 二 (1 十 7)"M. 
例 2 污水 处 理 厂 每 天 可 将 处 理 池 的 污水 (中 含 污 物 ) 浓 度 降 低 一 个 固定 比例 9, 问 多 
长 时 间 才 能 使 污水 浓度 降低 一 半 ? 
记 第 & 天 的 污水 浓度 为 cs, 则 第 & 十 1 天 的 污水 浓度 为 
cHi = (1l— gq)c, k=0,1,2,. (2) 
从 k==0 开始 递 推 n 次 得 cv 一 (1 一 "co 以 cs 一 co/2 代 人 可 解 出 一 
水 浓度 降低 一 半 . 
上 面 的 例子 研究 的 是 本 息 和 污水 浓度 两 个 动态 过 程 ,并 且 是 在 离散 的 时 间 点 上 对 其 
进行 观测 和 描述 , 称 为 离散 动态 过 程 ( 或 离散 动态 系统 ), 哩 然 它 们 实际 的 变化 可 以 是 连续 
的 (如 污水 浓度 ). 用 以 表述 离散 动态 过 程 规律 的 数学 模型 (1),(2) 式 , 称 为 差分 方程 ,实际 
上 就 是 变量 zx (和 ce) 对 的 递 推 公式 . 
差分 是 微分 的 近似 , 当 函 数 以 离散 数据 形式 表示 时 ， 函数 的 数值 微分 就 要 借助 差分 来 
计算 . 
这 个 实验 的 主要 部 分 是 差分 方程 ,2. 1 节 至 2.4 节 用 线性 差分 方程 .方程 组 和 非 线性 
方程 建立 几 个 实际 的 离散 动态 过 程 的 数学 模型 ,用 MATLAB 计算 数值 解 ,并 适当 地 进行 
理论 分 析 ,2. 5 节 简 要 介绍 数值 微分 ,2. 6 节 布 置 实验 练习 
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2.1 一 阶 线性 常 系数 差分 方程 


2.1 一 阶 线性 常 系数 差分 方程 


上 面 的 (1) 式 ,(2) 式 就 是 最 简单 的 一 阶 线性 常 系数 差分 方程 ,让 我 们 再 看 一 个 实例 . 


2.1.1 濒危 物种 的 自然 演变 和 人 工 贱 化 


问题 ”Florida 沙丘 鹤 属 于 濒危 物种 , 据 报道 ,生态 学 家 估计 它 在 较 好 的 自然 环境 下 ， 
年 平均 增长 率 仅 为 1. 94%, 而 在 中 等 及 较 差 的 自然 环境 下 ,年 平均 增长 率 则 分 别 为 
一 3. 24% 和 一 3. 82%, 即 它 将 逐年 减少 . 如 果 在 某 自然 保护 区 内 开始 有 100 只 瞧 , 建 立 描 
述 其 数量 变化 规律 的 模型 ,并 作 数 值 计 算 . 
人 工钱 化 是 挽救 这 个 濒危 物种 的 措施 之 一 ,如 果 每 年 人 工 孵 化 5 只 稚 放 人 该 保护 区 ， 
那么 在 中 等 自然 环境 下 沙丘 鹤 的 数量 将 如 何 变化 ? 
模型 及 其 求解 ” 记 第 年 沙丘 锥 的 数量 为 zx, 自然 环境 下 的 年 平均 增长 率 为 r, 且 
a 一 1 十 ~, 则 第 & 十 1 年 鹤 的 数量 为 
xi =arit, a=1+r, k= 0,1,2,. (3) 
在 较 好 、 中 等 和 较 差 的 自然 环境 下 ,以 r==0. 0194, 一 0.0324 和 一 0.0382 以 及 zx。 二 100 代 
入 ,用 MATLAB 计算 并 作 图 ,程序 如 下 : 


function x= exf11(x0,n,r) % 建立 名 为 exf11 的 函数 M 文 件 , x0,n,r 可 调节 
a= 1+r; 
x= x0; % 赋 初 值 
fork=1:n 
x(k+t+1)=ax x(k); % 按照 (3) 式 迭代 计算 
end 
k= (0 : 20)'; 
y1=exf11(100,20,0.0194) ; % 给 定 x0,n,r, 调 用 exf11 计算 


y2= ex{11(100,20,—0.0324); 
y3= ex{t11(100,20,—0.0382); 


round([k,y1', y2', y3"]), % 对 结果 四 舍 五 人 取 整 
plot(k,yl,k,y2，: kk,y3,--D]， % 将 3 条 线 画 在 一 个 图 .上 
gtext(r=0.0194'), gtext(r= —0.0324'), gtext(r= —0.0382), % 在 图 上 做 标记 


得 到 的 结果 如 表 2.1 (第 1~4 列 ) 和 图 2. 1 所 示 . 
在 人 工钱 化 条 件 下 , 设 每 年 锋 化 的 数量 为 6, 则 (3) 式 将 变 为 
Zhi = Qari+b, & 一 1 十 r， k=0,1,2,. (4) 
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表 2.1 (3) 式 和 (4) 式 的 计算 结果 
EE RE [RE 


LA Zk re (b=5) 
(r=0.0194) (r 一 一 0.0324) (r 一 一 0.0382) (r 一 一 0.0324) 

0 100 | 100 100 100 

1 102 | 97 ”96 | 102 

2 .104 94 93 103 


106 91 89 105 


) 一 一 0.0324, b=5 


图 2.1 按 (3) 式 计算 的 曲线 图 2.2 按 {4) 式 计算 的 曲线 


在 中 等 自然 环境 下 (r= 一 0.0324) 以 4 一 5 代 人 ,用 MATLAB 计算 得 到 的 结果 如 
表 2. 1 最 后 一 列 和 图 2. 2 所 示 . i 
结果 分 析 ”讨论 时 间 充 分 长 以 后 沙丘 稚 数 量 的 变化 趋势 ， 即 一 < 时 Xi 的 极限 
在 自然 环境 下 (3) 式 的 解 的 形式 为 
一 ar aa 一 1 十 r， 有 一 0,1,2,… (5) 
显然 当 a>1( 即 ”>0) 时 一 co， 而 a<1( 即 r<0) 时 zt 习 0, 表明 在 中 等 及 较 差 的 自然 
环境 下 沙丘 鹤 将 濒于 灭绝 . 


2.2 高 阶 线性 常 系数 差分 方程 


在 人 工 狩 化 条 件 下 由 (4) 式 可 得 
zf 一 aktro 十 (1-Ha 十 … 十 ac 和) 一 acro 十 0 人 


当 a 过 1( 即 7r<0) 时 xz 一 z= 二 6/(1 一 a). 对 于 充分 大 的 & 用 (4) 式 计算 xz; 的 结果 如 图 2. 3， 
且 得 zzoo 王 154. 25. 可 与 上 述 结果 x==6/(1 一 a)==b/( 一 r)= 二 5/0.0324 二 154. 32 对 比 . 


k=0,1,2,. (6) 


160 


盖 一 0.0324, b=5 


140 

130 | 

120 

110 -| 
1000 50 100 150 200 


图 2.3 按 (4) 式 计算 的 曲线 (k 充分 大 ) 


2.1.2 一 阶 线性 常 系数 差分 方程 的 解 . 平 衡 点 及 其 稳定 性 


上 面 例子 中 的 (3) 式 ,(4) 式 都 是 一 阶 线 性 常 系数 差分 方程 ,其 一 般 形式 如 (4) 式 , a， 
b 是 已 知 常数 ,差分 方程 (4) 中 令 -一 Al 一 之 得 到 的 代数 方程 


工 一 ar 十 0 (7) 
的 根 x 二 6/(1 一 a) 称 为 差分 方程 的 平衡 点 . 差分 方程 (4) 的 解 可 表 为 
xt =cat+b/(l a), k=0,1,2,.… (8) 


c 由 初始 值 ze 确定 . 
如 果 &~~co 时 zs 一 x， 称 平衡 点 x 是 稳定 的 , 否则 平衡 点 工 是 不 稳定 的 . 显然 , 由 (8) 
式 可 知 ,差分 方程 (4) 的 平衡 点 稳定 的 充 要 条 件 是 |a| 雪 1. 


2.2 高 阶 线性 常 系数 差分 方程 

如 果 第 & 十 1 时 段 变量 zx 不 仅 取决 于 第 有 时 段 变量 zt, 而 且 与 以 前 时 段 变量 有 关 ， 
就 要 用 高 阶 差分 方程 来 描述 . 
2.2.1 一 年 生 植 物 的 繁殖 


问题 ”一年生 植物 春季 发 芽 , 夏 天 开花 ,秋季 产 种 ,没有 腐烂 .风干 .被 人 为 掠 去 的 那 
些 种 子 可 以 活 过 冬天 ,其 中 的 一 部 分 能 在 第 二 年 春季 发 芽 , 然 后 开花 、 产 种 ,其 中 的 另 一 部 
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分 虽 未 能 发 芽 , 但 如 又 能 活 过 一 个 冬天 , 则 其 中 一 部 分 可 在 第 三 年 春季 发 芽 , 然 后 开花 、 产 
种 ,如 此 继续 . 一 年 生 植物 只 能 活 1 年 ,而 近似 地 认为 ,种 子 最 多 可 以 活 过 两 个 冬天 . 试 建 
立 数 学 模型 研究 这 种 植物 数量 的 变化 规律 ,及 它 能 够 一 直 繁 殖 下 去 的 条 件 . 

模型 及 其 求解 ” 记 一 棵 植物 秋季 产 种 的 平均 数 为 c, 种 子 能 够 活 过 一 个 冬天 的 比例 
为 5, 一 岁 的 种 子 能 在 春季 发 芽 的 比例 为 a ,未 能 发 芽 但 又 能 活 过 一 个 冬天 的 比例 仍 为 5， 
两 岁 的 种 子 能 在 春季 发 芽 的 比例 为 ax. 设 c， ai ,as 圈定 ,而 4b 可 在 一 定 范围 内 变化 . 

记 第 年 的 植物 数量 为 zx ,按照 种 子 最 多 可 以 活 过 两 个 冬天 的 假定 ,zi 与 z:-! 和 
zi- 有关， 由 Zi 决定 的 部 分 显然 是 QIDCcZA-1 ,而 由 Xt-z 决 定 的 部 分 则 是 Q2 Xb(l—ai) XxX 
bcrs-2， 若 今年 (k 二 0) 种 下 (并 成 活 ) 的 植物 数量 为 ze, 可 以 得 到 


XI = abcro, X= abcreitab(l ~— a)bcries, k=2,3,. (9) 
记 p= 二 一 a1bc，, g 二 一 a26(1 一 a1) bc, 则 
3 Xl 十 pro 二 0， zt 十 Dzze 十 az 一 0， 有 一 2 3;，… (10) 


设 c=10, ai 二 0.5,as 二 0.25,6 二 0.18~0, 20, 且 zo 二 100, 用 MATLAB 计算 并 作 
图 ,程序 如 下 : 


_ function x= exf12(x0,n,b) % 建立 名 为 exf12 的 函数 M 文件 , x0, n, b 可 调节 
c=10;al=0.5;a2=0.25; 
P 一 一 al1xbxCi 
q= 三 一 a2x* (1 一 a1)x*Cxb2; 


x(1)=x0; % 赋 初 值 
x(2)= —pxx(]); % 按照 (10) 和 迭代 计 算 
for k=3:n 
xCk) 二 一 pxxCk 一 1) 一 qx x(k 一 2); % 按照 (10) 和 迭代 计 算 
end 
k= (0 : 20)"; 
y1= exf12(100, 21,0. 18); % 给 定 x0, n, b, 调 用 exf12 计算 


y2= exf12(100, 21,0. 19); 

y3= exf12(100, 21,0.20); 

roundC[k,y1',y2',y3"]), 

. piotCk,y1,k,y2,': ',Kk,y3,'-"), 

gtextC'b=0. 18') ,gtext('b=0.19'),gtext('b= 0.20") 

得 到 的 结果 如 表 2. 2 和 图 2.4 所 示 . 

结果 分 析 “可 以 看 到 ,对 于 不 同 的 ,xx 的 变化 规律 有 较 大 差别 . 为 了 研究 这 种 差别 
的 机 理 , 需 要 得 到 方程 (10) 的 解 的 表达 式 . 注意 到 一 阶 差 分 方程 (3) 的 解 为 (5) 式 ,对 于 二 
阶 差分 方程 可 以 寻求 形 如 zi 二 和 * 的 解 , 将 其 代入 (10) 式 得 

和 十 从 十 gq = 二 0. (11) 


2.2 高 阶 线性 常 系数 差分 方程 


表 2.2 (10) 式 的 计算 结果 


k zi (60=0. 18) Zz: (b=0.19) zx: (b=0. 20) 
0 100 100 100 
1 90 95 100 
2 ” 85 95 105 
3 80 94 110 
4 b 76 94 115 
15 40 89 | 192 
16 37 89 202 
17 35 88 211 
18 33 88 221 
19 31 88 232 
20 30 87 -243 


代数 方程 (11) 称 为 差分 方程 (10) 的 特征 方 


程 ,方程 (11) 的 根 
a | 
Ai.2 一 p+ 2 49 (12) 

称 为 差分 方程 (10) 的 特征 根 ,方程 (10) 的 解 
可 表 为 | 

Xe 一 Cht 十 coh， k=0,1,2,.° (13) 
其 中 常数 C1， cz 由 初始 条 件 之 0， Zz 确定. 0 5 10 15 20 

对 于 本 例 ,用 p= 一 aibc, gq 二 一 asb(1l 一 。 图 2.4 表 2.2 的 图 示 
a)jbc,c= 10,a) 二 0.5, as 一 0.25 代入 
(12) 式 得 
pr aibc 土 a Ey 5 二 0,, (14) 


当 0 一 0. 18，0. 19，0. 20 时 ,CX1,44) 分 别 为 《0.9430, 一 0.0430)，(0. 9953 ， 一 0. 0453 ) ， 
(1.0477， 一 0.0477). 对 于 45 二 0.18;, 用 zo 一 100,xi 二 90 代入 (13) 式 ,可 解 出 < 一 95. 64， 
cz 一 4. 36 ,于 是 | 

xk = 95.64(0.943)* 二 4.36(—0.043)*,， k= 0,1,2,.. (15) 


二 
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对 于 6 二 0.20, 用 zo 二 zi 二 100 代 人 (13) 式 ,可 解 出 cl 一 95. 65 ,cs 二 4.35, 于 是 
x = 95.65(1.0477)* 二 4.35(—0.0477)*， = 0,1,2, (16) 
用 (15) 式 ,(16) 式 计算 的 结果 应 该 与 表 2. 2 一 样 . 
可 以 看 出 , 当 | s|<1 时 ze0CG>co), 当 | Ai| 之 1 时 六 co(E->co). 由 (14) 式 
容易 得 到 ,zx 一 co( 即 植物 能 够 一 直 繁 殖 下 去 ) 的 条 件 为 6 二 0. 191. 


2.2.2 蛛网 模型 的 推广 


问题 1.2.2 节 市 场 经 济 中 的 蛛网 模型 中 ,商品 价格 y: 依 赖 于 商品 数量 zx, 方程 由 
实验 1 中 (4) 式 给 出 ,商品 数量 z+ 依赖 于 价格 y ,方程 由 实验 1 中 (5) 式 给 出 . 如 果 生 产 
经 营 者 的 管理 水 平和 素质 更 高 一 些 , 在 决定 产量 zt+* 时 不 仅 根 据 价 格 yti ,而且 考 虑 更 
前 时 段 的 价格 yi. 在 1.2.2 节 的 基础 上 建立 新 的 模型 ,并 讨论 经 济 趋向 稳定 的 条 件 有 什 


么 变化 . 
模型 及 其 求解 ”1..2.2 节 市 场 经 济 中 的 蛛网 模型 的 (4) 式 ,5) 式 分 别 为 
Yi yo =—a(l(rz—7z0), a>0, k=1,2,. (17) 
Zhih 一 To 一 8 一)， 8 二 0， k=1,2, (18) 
如 果 zt+z 由 yeti 和 yi 共同 决定 ,为 简单 起 见 , 设 z+: 取 决 于 它们 的 平均 值 ,将 (18) 式 改 为 
zt 一 zo = Be 站)， 8 二 0， R 一 1;2,… (19) 
2 十 apRzreh 十 apBzrx 2(1 十 cp8)zo， k= 1 2，… (20) 
知道 了 To .yo TX1, TX2 ;QB; 可 以 用 (17) 式 , (19) 式 或 (20) 式 计算 TR? Yk: 
二 阶 差分 方程 (20) 的 特征 方程 为 | 
2 十 aBA 十 aB = 0. (21) 
容易 算出 特征 根 为 。 
各 全 二 a8 丰 2 一 8cp (22) 


在 差分 方程 (20) 中 令 zi44 一 ziw1 二 xi 二 x, 可 知 平衡 点 仍 为 zx= ze ,方程 (20) 的 解 可 表 为 
Tk 二 MM 十 czA 十 Xo， 下 二 12 | (23) 

C1， cz 由 初始 值 Zi, zz 确定 . 
由 (23) 式 可 知 ,ze-> zo (ko0) (经济 趋向 稳定 ) 的 条 件 是 | 罗 ,z| <1, 而 从 (22) 式 可 以 

算出 (这 里 久 .., 是 复数 , |X,. ;| 指 模 ) 

| 4112 | 一 VaB/2. (24) 

所 以 经 济 趋向 稳定 的 条 件 是 
aB <2. | (25) 


NT 


2.3 线性 常 系数 差分 方程 组 
与 1.2.2 节 中 的 稳定 条 件 ag<1 相 比 ,参数 a,8 的 范围 放大 了 (a,8 的 含义 未 变 ) ,可 以 想 
到 ,这 是 因为 生产 者 的 管理 水 平和 素质 提高 ,对 经 济 稳定 起 着 有 利 影响 的 必然 结果 . 
2.2.3 高 阶 线性 常 系数 差分 方程 的 解 . 平 衡 点 及 其 稳定 性 
前 面 对 二 阶 线性 常 系数 差分 方程 的 分 析 和 结果 可 以 推广 到 高 阶 线 性 常 系数 差分 方程 


aozru 十 ar 十 十 ar 十 ao 一 D， 有 一 1 2 (26) 
其 特征 方程 为 
ao 驴 十 ah 十 … 十 ar 十 av 一 0. (27) 
记 特 征 根 为 A ，X。，… ,4, ,差分 方程 (26) 的 解 为 
Zh 二 CIA 十 cA 十 … 十 cA 十 ZX， 二 1,2,…… (28) 


其 中 工 是 (26) 式 中 令 za ,一 … 一 你 一 工 得 到 的 平衡 点 ,cr ，…,c, 由 初始 值 xz;，… ,x, 确 
定 . 当 所 有 特征 根 的 模 小 于 1 时 ,平衡 点 是 稳定 的 . 


2.3 线性 常 系数 差分 方程 组 

当 我 们 研究 的 对 象 是 若干 变量 构成 的 一 个 向 量 的 离散 动态 过 程 时 ,用 差分 方程 组 描 
述 比较 方便 . 
2.3.1 汽车 租赁 公司 的 运营 


问题 “一 家 汽车 租赁 公司 在 3 个 相 邻 的 城市 运营 ,为 方便 顾客 起 见 公司 承诺 ,在 一 
个 城市 租赁 的 汽车 可 以 在 任意 一 个 城市 归还 . 


根据 经 验 估计 和 市 场 调查 ,一 个 租赁 期 内 在 A Go、 
市 租赁 的 汽车 在 A,，B,:C 市 归还 的 比例 分 别 i 


为 0.6, 0,3, 0.1; 在 B 市 租赁 的 汽车 在 A, B， 
C 市 归还 的 比例 分 别 为 0.2, 0.7, 0.1; 在 C 市 0.1 
租赁 的 汽车 在 A, B, C 市 归还 的 比例 分 别 为 ”图 2.5 3 个 城市 间 汽车 数量 比例 的 转移 
0.1，0. 3，0.6. 若 公司 开业 时 将 600 辆 汽车 平 
均 分 配 到 3 个 城市 ,建立 运营 过 程 中 汽车 数量 在 3 个 城市 间 转 移 的 模型 ,并 讨论 时 间 充 分 
长 以 后 的 变化 趋势 . 

模型 及 其 求解 ” 记 第 有 个 租赁 期 末 公 司 在 A,，B，C 市 的 汽车 数量 分 别 为 zi CR)， 
zz(&R)，zs(R)，3 个 城市 间 汽 车 数量 比例 的 转移 可 直观 地 用 图 2. 5 给 出 . 按照 这 个 转移 关 
系 容易 写 出 第 & 十 1 个 租赁 期 末 公 司 在 A, B, C 市 的 汽车 数量 为 (k 二 0,1,2,…) 
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ZXz(k 十 1) 二 0.3zxi1(k) 十 0.7zz(k) 十 0.3xsa(k)， (29) 
Za(R 十 1) 二 0.1zi(k) 十 0.1zxz(k) 十 0.6zxs(k). 
记 向 量 x(k)=[zxi(k), 2(R) ， za(R) ,矩阵 


(十 1) 三 0.6zi(R) 十 0.2zz(R) 十 0.1z3y(R)， 


0.6 0.2 0.1 
玫 三 区 0.7 | (30) 
; 0.1 0.1 0.6 
则 (29) 式 可 表 为 
x(R 十 1) = Ax(k), k=0,1,2,.: . (31) 


给 定 初始 值 x(0) ,可 以 用 (31) 式 计算 各 个 租赁 期 3 个 城市 汽车 数量 的 变化 . 如 开始 
时 600 辆 汽车 平均 分 配 到 3 个 城市 ,用 MATLAB 计算 x(k) 的 程序 如 下 : 


A=[0.6,0.2,0.1;0.3,0.7,0.3;0.1,0.1,0.6]; 
xC : ,1) =[200,200,200]'; % 赋 初 什 
n= 10; 
for k=1:n 
xC: ,kKk+ DD)=Axx(: ,k); % 按照 (3 了 DD 式 迭代 计算 
end 
round(x) ， 
k=0 : 10; 
plotCk, x) ,grid， 
gtext('x1Ck)') ,gtextC'x2(k) ,gtextC'x3Ck)') , 


得 到 的 结果 见 表 2. 3 和 图 2. 6(a). 
表 2.3 (31) 式 的 计算 结果 (开始 时 600 辆 汽车 平均 分 配 到 3 个 城市 ) 


可 以 看 到 ,时 间 充分 长 以 后 3 个 城市 汽车 数量 趋 于 180，300，120， 

这 个 结果 与 初始 条 件 有 关 吗 ?如果 开 始 时 600 辆 汽车 全 分 配给 A 市 ,可 得 结果 如 
表 2. 4 种 图 2.6(b). 

由 上 面 的 计算 可 以 猜想 ,时 间 充分 长 以 后 3 个 城市 的 汽车 数量 趋向 稳定 ,并 且 稳 定 什 
与 600 辆 汽车 的 初始 分 配 无 关 . 


ret er 


2.3 线性 常 系数 差分 方程 组 


表 2.4 (31) 式 的 计算 结果 (开始 时 600 辆 汽车 全 分 配给 A 市 ) 


x3(f) 


2 4 6 8 10 0 2 4 6 8 10 
(a) 表 2.3 的 图 示 (b) 表 2.4 的 图 示 


图 2.6 (31) 式 的 计算 结果 


结果 分 析 ”为 了 证 实 上 面 的 猜想 , 记 稳定 什 为 x, 由 (31) 式 x 应 满足 
Ax=x (32) 
这 表明 和 矩阵 4 的 一 个 特征 根 4 二 1, 且 x 是 对 应 的 特征 向 量 . 
事实 上 ,从 矩阵 4 各 列 之 和 均 为 1 立即 可 知 ,4 有 特征 根 4 二 1( 为 什么 ?) , 且 特 征 向 
量 x 可 由 (32) 式 直接 算出 (当然 应 该 利用 x 的 各 分 量 之 和 等 于 初始 值 600). 


2.3.2 按 年 龄 分 组 的 种 群 增长 


问题 ”野生 或 包养 的 动物 因 繁殖 而 增加 , 因 自然 死 亡 和 人 为 屠杀 而 减少 ,不 同年 龄 动 
物 的 繁殖 率 .死亡 率 有 较 大 差别 ,因此 在 研究 某 一 种 群 数 量 的 变化 时 ,需要 考虑 按 年 龄 分 
组 的 种 群 增长 . 

将 种 群 按 年 龄 等 间隔 地 分 成 若干 个 年 龄 组 ,时 间 也 离散 化 为 时 段 . 给 定 各 年 龄 组 种 群 
的 繁殖 率 和 死亡 率 (在 稳定 环境 下 不 妨 假 定 它们 与 时 段 讯 关 ) ,建立 按 年 龄 分 组 的 种 群 增 
长 模型 ,预测 未 来 各 年 龄 组 的 种 群 数量 ,并 讨论 时 间 充 分 长 以 后 的 变化 趋势 . 

模型 及 其 求解 ” 设 种 群 按 年 龄 等 间隔 地 分 成 n 个 年 龄 组 , 记 i 二 1,2,…,n, 时 段 记 作 
k=0,1,2,…, 且 年 龄 组 区 间 与 时 段 长 度 相 等 ( 若 5 岁 为 一 个 年 龄 组 , 则 5 年 为 二 个 时 
段 ). 以 肉 性 个 体 为 研究 对 象 比 较 方便 ,以 下 种 群 数 量 均 指 其 中 的 上 肉 性 , 

记 第 i 年 龄 组 在 时 段 k 的 数量 为 zx;(k) ;第 i 年龄 组 的 繁殖 率 为 6;, 表 示 每 个 ( 肉 性 ) 


个 体 在 一 个 时 段 内 繁 苞 的 数量 ;第 i 年 龄 组 的 死亡 率 为 d;, 表 示 一 个 时 段 内 死亡 数 与 总 数 
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人 


实验 2 差分 方程 和 数值 微分 


之 比 ,s; 二 1 一 di;, 称 为 存活 率 . 
为 建立 zx;(k) 的 变化 规律 我 们 注意 到 ,第 1 年 龄 组 在 时 段 & 十 1 的 数量 为 各 年 龄 组 在 
时 段 & 繁殖 的 数量 之 和 ， 即 


(RE 十 1) = Dbrilk), k=0,1,. (33) 
im 】 
而 第 i 十 1 年 龄 组 在 时 段 & 十 1 的 数量 是 第 i 年 龄 组 在 时 段 & 存活 下 来 的 数量 , 即 
ZHI(R 十 1) = sr;(k), z 一 1 2 1 一 上， 有 一 0 1,，… (34) 
记 种 群 各 年 龄 组 在 时 段 £ 的 数量 (向 量 ) 为 
: xCk) = [riCk) ,ra Ck) ,x(k)], (35) 


”将 6; 和 si; 排 成 如 下 的 矩阵 ( 称 Leslie 矩阵 ) 


by bs 1 bo b,) 
5s 0 0 0 
| (36) 
0 0 Sm1 0 
则 (33) 式 ,(34) 式 可 表 为 | 
x(R 十 1) = Lx(k), k=0,1,. (37) 
给 定 种 群 各 年 龄 组 的 初始 数量 x(0), 可 以 预测 种 群 各 年 龄 组 在 任意 时 段 & 的 数量 为 
x(k) = Lix(0), k=0,1,.: (38) 


将 x(4) 归 一 化 后 的 向 量 记 做 x(8) , 称 种 群 按 年 龄 组 的 分 布 向 量 , 

设 一 种 群 分 成 5 个 年 龄 组 ,繁殖 率 b= 二 0, 5s 二 0.2, bs 二 1.8, 6b, 二 0.8, 5 一 0.2， 存 
活 率 5 一 0.5, ss 二 0.8, ss 二 0,8, 54 王 0.1, 各 年 龄 组 现 有 数量 均 为 100 只 ,由 (36) 式 ， 
(37) 式 用 MATLAB 计算 x(4) ,x(&) 的 程序 如 下 : 


b=[0,0.2,1.8,0.8,0.2]; 


s= diag([0.5,0.8,0.8,0.1)]); % 对 角 阵 ,对 角 元 素 为 0.5,0.8,0.8,0.1 
L=[b;s,zeros(4,1)]; % 按照 (36) 式 构造 矩阵 上 
x(: ,1)= 100* ones(5,1); ””% 赋 初 什 
n= 30; 
for k=1:n 
xC: ,kt+1)=LxxC: ,k); % 按照 (37) 式 迭代 计算 
end 
round (x), 
y= diag([ 1. /sum(x) ]); % 为 向 量 x 归 一 化 做 的 计算 


z=xxy, % z 是 向 量 x 的 归 一 化 
k=0: 30; 


2.3 线性 常 系数 差分 方程 组 
subplot(1,2,1), plot(k,x) ,grid， % 在 一 个 图 形 窗 内 通 两 张 图 
subplot(1,2,2), plot(k,z) ,grid 
得 到 的 结果 见 表 2.5, 表 2.6 和 图 2. 7. 
表 2.5 x(k) 的 计算 结果 


k 0 1 2 3 4 26 27 28 29 30 
ZI(R) 100 300 220 155 265 "oe 393 403 412 423 | 434 
x2(k) 100 50 150 110 77 i 190 196 201 206 211 
Xa (k) 100 | 80 40 | 120 88 149 152 157 161 165 


400 0.6 -| 

300 
0.4 | 

200 

100 可 0.2 

0 上 0 

0 5 10 15 20 25 30 0 5 10 153 20 25 30 
(a) x( 妥 的 图 形 (六 的 图 形 
( 自 上 而 下 为 xi( 日 至 xs()) (上 而 下 为 总 ( 妇 至 知 ( 昌 ) 


图 2.7 (37) 式 的 计算 结果 


结果 分 析 ”从 表 2.6 和 图 2.7(b) 可 以 看 出 ,时 间 充 分 长 以 后 种 群 按 年 龄 组 的 分 布 向 
量 x(R) 趋 向 稳定 ,这 种 状况 与 Leslie 矩阵 的 如 下 性 质 有 关 ( 设 矩阵 工 第 一 行 有 两 个 顺序 
的 0 大 于 零 ) ; 


Si 


实验 2 差分 方程 和 数值 微分 


和 矩阵 工 有 正音 特征 根 4, ,对 应 特征 向 量 为 


下 
We 51 S152 ..。3132 3-1 
[1 时， A ] ba 
对 于 工 的 其 他 特征 根 A4; 有 |4; | 过 和 (i 二 2,3,…,n), 且 由 (38) 式 确定 的 x(%) 满 足 
lim AD) 一 cx (40) 


其 中 <c 是 与 6;, se,xz(0) 有 关 的 常数 (请 读者 在 矩阵 工 可 对 角 化 的 条 件 下 证 明 (40) 式 ). 
由 上 述 性 质 可 以 对 时 间 充 分 长 以 后 的 xC8) ,xX(&) 做 出 如 下 分 析 ( 以 下 丸 记 作 久 ): 
(1) 记 归 一 化 的 特征 向 量 x* 为 x, 则 
xX(k) 和 区 (41) 
与 x(0) 无 关 , 即 按 年 龄 组 的 分 布 向 量 x(k) 趋 向 稳定 分 布 x Xx. | 
(2) 因为 x(k) 守 cAXx* ,所 以 
x(k+1) = Ax Ck), (42) 
即 各 年 龄 组 的 数量 按照 同一 比例 4 增 减 ,4 称 固有 增长 率 . 可 将 (42) 式 与 基本 方程 (37) 相 
对 比 . 
(3) 由 工 的 特征 方程 


妨 一 (00 十 sp 十 … 十 ss ws ip ) 一 0 (43) 
可 知 , 当 
Di 十 sib sisb; 二 十 $15.51b, = 1 (44) | 
人 各 年 龄 组 的 数量 不 变 , 且 由 (39) 式 知 特征 向 量 ， 
x” = [ld yy ek (45) : 
再 注意 到 x(&)szcltxz* ,(45) 式 给 出 
xi (k) 2 siri(k), (46) 


即 存 活 率 si 等 于 同一 时 段 相 邻 年 龄 组 的 数量 之 比 , 可 将 (46) 式 与 基本 方程 (34) 对 比 . 

用 本 例 的 数据 对 上 面 的 稳 态 分 析 作 验证 . 

(1) 用 MATLAB 可 得 到 矩阵 上 的 全 部 特征 根 ,其 中 最 大 的 为 和 1 二 1.0254, 由 (39) 式 
容易 计算 特征 向 量 x" , 归 一 化 得 x 二 [0. 4559, 0. 2223,.0.1734, 0.1353, 0.0132]" ,与 表 
2. 6x(&) 的 计算 结果 相近 , 即 (41) 式 . 

(2) 在 表 2. 5x(&) 的 计算 结果 中 ,对 于 大 的 上 和 ;7 一 1,2,…，5,zk 十 1) / xi(k) 的 值 
在 4 二 1.0254 附近 (zs(&) 的 值 较 小 , 取 整 后 计算 误差 较 大 ), 即 (42) 式 . 

(3) 因 4=1.0254 比 1 略 大 ,可 以 由 表 2.5 或 表 2.6 对 于 大 的 &i 近似 验证 (46) 式 . 


2.4 非 线性 差分 方程 


上 面 几 节 讨论 的 都 是 线性 差分 方程 ,可 以 描述 一 些 比较 简单 的 变化 过 程 , 考 虑 稍微 复 
杂 些 的 问题 就 会 出 现 非 线性 差分 方程 


2.4 非 线性 差分 方程 


2,4.1 离散 形式 的 阻 灌 增长 模型 (离散 形式 的 Logistic 模型 ) 

问题 ”1.2.4 节 介绍 的 两 个 人 口 模型 是 指数 增长 模型 和 阻 澡 增 长 模型 ,在 那里 人 口 
z(t) 是 连续 函数 ,得 到 的 是 微分 方程 , 见 实验 1 中 (18) 式 和 (23) 式 , 实际 上 资源 制约 下 任 
意 种 群 数量 的 变化 都 服从 这 样 的 规律 . 建立 对 应 于 这 两 个 连续 模型 的 离散 模型 ,在 不 同 的 
增长 率 下 讨论 种 群 数量 的 变化 趋势, 

模型 及 其 求解 ”以 种 群 繁殖 的 周期 划分 时 段 , 记 时 段 (或 第 上 代 ) 的 种 群 数量 为 
zi 增长 率 是 ,于 是 指数 增长 模型 的 离散 形式 可 表 为 

. ZHl 一 2 一 FT k=0,1,2,. (47) 

这 是 一 阶 线性 常 系数 差分 方程 , 它 的 解 已 经 讨论 过 ,这 里 不 再 研究 . 

当 增 长 受到 资源 制约 时 , 设 种 群 最 大 容量 为 N, 阻 滞 增 长 模型 的 离散 形式 可 表 为 


过。 zs =7(1 rea ee (48) 
方程 (48) 是 非 线性 差分 方程 ,r 是 固有 增长 率 . 对 于 不 同 的 r+, 按 照 方程 (48) 研 究 上 充分 大 


不 妨 设 N= 二 1, 取 r= 二 0.3, 1.8, 2.5, 初 值 x。 = 二 0.1, 按 照 方 程 (48) 用 MATLAB 计算 
Zt 的 程序 如 下 : 


r=[0.3,1.8, 2.5]; 


x=0.1; % 赋 初 值 
n= 40; 
for j=1:3 
R=r(); %- 取 r 值 
for j=1:n 
x(i 十 1) 二 x( 站 十 Rxx(D) # (1 一 x(D)); 。”% 按照 (48) 式 迭代 计算 
end 


XxxC : ,j) =x'; 


end 

k= (0 : 40)'; 

[Ck,xx] % 输出 结果 

subplot(1,3,1) ,plot(k,xx( : ,1)), % 在 一 个 图 形 窗 内 画 3 张 图 


subplot(1,3,2) ,plotC(k.xxC : ,2)7， 
Subplot(1,3,3) ,plot(k ,xx( : ,3))， 


得 到 的 结果 如 表 2.7 和 图 2. 8. 
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Zr 一 0.3) 
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zxi(r=1.8) 


表 2.7 模型 (48) 的 计算 结果 


Zz (r= 2.5) 


ZX (r=0. 3) 


0.7192 


0. 1000 0. 1000 - 0. 1000 3 0.9997 1.0001 1.1577 
0. 1270 0. 2620 .3250 32 0. 9998 0.9999 0.7012 
0. 1603 0. 6100 0. 8734 33 0. 9998 1. 0000 1. 2250 
0. 2006 1.0382 1.1498 34 0.9999 1.0000 0.5359 
0.2487 0.9668 35 0.9999 1.0000 1.1577 


. 3048 


.0246 


.2241 


图 2.8 表 2.7 的 图 示 


上 述 结果 表明 :r= 一 0. 3 时 zi 单调 地 趋向 NN 二 1;r 二 1.8 时 x 振荡 地 趋向 N=1; 而 r 


2.5 时 zi 不 收敛 . 


结果 分 析 ”在 数值 实验 的 基础 上 对 这 个 模型 作 一 些 简要 的 理论 分 析 : 
(1) 将 非 线 性 差分 方程 (48) 写 作 


在 (49) 式 中 令 XE 


Zk 
EEE A A 


得 到 代数 方程 


wkA+1l 一 并 


N 


jz 0 1 ss 


[1 太守 


(50) 


2.4 非 线性 差分 方程 


方程 (50) 的 根 是 差分 方程 的 平衡 点 . 容易 看 出 方程 (49) 有 两 个 平衡 点 : zx 王 N，z 一 0. 
与 线性 差分 方程 一 样 , 若 z,-> z(A->co) ,平衡 点 zx 是 稳定 的 ,否则 ,x 不 稳定 . 
(2) 非 线 性 差分 方程 平衡 点 稳定 的 条 件 
一 般 地 考察 非 线 性 差分 方程 
yu = f ly) k=0,1,2,. (51) 
代数 方程 y= f(y) 的 根 是 非 线 性 差分 方程 (51) 的 平衡 点 , 记 作 六 .为 研究 y* 的 稳定 性 ， 
将 函数 f 在 y' 点 作 Taylor 展开 ,保留 线性 项 ,得 到 方程 (51) 的 近似 线性 方程 
yn = fy ymy' )+y  ， k=0,1,2,. (52) 
显然 y" 也 是 方程 (52) 的 平衡 点 . 


可 以 证 明 , 当 | 疡 (> )| 关 1 时 方程 (51) 与 方程 (52) 平 衡 点 的 稳定 性 相同 . 而 方程 (52) 


是 一 阶 线性 常 系数 差分 方程 ,根据 其 平衡 点 稳定 的 条 件 可 得 , 当 
| fCy*)|<1 (53) 
时 方程 (51) 的 平衡 点 y' 是 稳定 的 ; 当 
| f(y')|>1 (54) 
时 方程 (51) 的 平衡 点 y' 不 稳定 . | 
(3) 利用 变量 和 参数 代 换 


二 0 一 rr 十 1， (55) 
可 将 方程 (49) 化 简 为 : | 
yet = byi(l—y), k=0,1,2,° (56) 
方程 (49) 的 平衡 点 z+ 二 N, x 二 0 分 别 对 应 于 (56) 式 的 两 个 平衡 点 : y= 二 1 一 1/b,y 二 0. 记 
f(y) = by(l1— y), (57) 
则 
f(y) = 6(1— 2y). (58) 


以 平衡 点 y= 二 1 一 1/6, y= 二 0 分 别 代 入 (58) 式 计算 ,可 得 六 (0) 二 6 之 1, 由 判 据 (54) 式 知 
y 二 0 不 稳定 ,以 后 不 再 讨论 它 ; 而 


f(1—1/6) 一 2 一 0 (59) 
由 判 据 (53) 式 和 代 换 (55) 式 可 知 ， 平衡 点 y 一 光 三 1 一 1/6 稳定 的 条 件 是 
1 二 5 二 3 即 r< 之 2. (60) 


回顾 前 面 的 计算 结果 ,r= 二 0.3 和 7=1.8 时 zi 一 N( 即 y, 一 y" ) 是 符合 这 个 结论 的 . 

若 6 之 3( 即 7 之 2) ,由 判 据 (54) 式 知 平衡 点 y" 不 稳定 ,因此 ,前 面 的 计算 中 7 二 2.5 时 
心 不 收 敛 .从 表 2.7 和 图 2. 8 还 可 看 出 ,虽然 这 时 zi 不 收敛 ,但 是 似乎 它 的 变化 仍 有 某 种 
规律 ,我 们 将 在 实验 6 继续 研究 。 

还 可 以 看 到 ,对 于 > ==0.3 和 r=1,8,zxs 一 NN 的 形态 是 不 同 的 ,实际 上 ,差分 方程 (56) 
的 递 推 过 程 可 以 用 图 2. 9 直观 地 演示 : 
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以 y 为 模 坐 标 画 出 曲线 xz 二 f(y) 和 直线 xz 一 y, 二 者 交点 的 横 坐 标 为 平衡 点 y* . 对 于 
任意 初 值 wm ,由 方程 (56) 计 算 y, ，ys，… 的 过 程 表示 为 图 2,9 上 涯 箭 头 的 折线 .5<<2( 即 
r<1) 时 y* 二 1/2,ys 一 y* 的 过 程 是 单调 的 ,如 图 2. 9(a);2<0<3( 即 1<r<2) 时 y 之 
1/2, yi 下 y" 的 过 程 会 出 现实 验 1 中 图 1. 4(a) 蛛 网 模型 那样 的 衰减 振荡 ,如 图 2. 9(b); 若 
/一 3( 即 "全 2) ,图 2.9(c) 出 现 了 实验 1 中 图 1.4(b) 蛛 网 模型 那样 的 发 散 振荡 . 


1 
1 
1 
1 
1 
| 


! 
| 
! 
| 
! 


' oe 
0 yoypiy yy 1y 0 J yr yh >》 0yo 狼 yl y 
(a) 单调 收敛 (p< 2) (b) 振 功 收 你 2<p< 3) (c) 不 收敛 (> 3) 


2.9 方程 (56) 的 递 推 过 程 


2.4.2 寄主 -寄生 模型 


问题 ”寄主 -寄生 现象 是 自然 界 中 常 有 的 ,如 黄蜂 的 幼虫 寄生 在 象 鼻 虫 (寄主 ) 体 内 . 一 
方面 ,寄主 通常 靠 自 然 资源 为 生 ,不 妨 假定 它 的 数量 变化 用 离散 形式 的 阻 滞 增 长 模型 (48) 描 
述 ,而 寄生 物 的 存在 会 减少 其 增长 . 显然 ,寄生 物 数量 越 多 ,寄主 的 增长 率 减少 得 越 多 ,最 
简单 的 假设 是 ,寄主 的 减少 率 与 寄生 物 数量 成 正比 . 另 一 方面 ,寄生 物 完全 靠 寄主 为 生 , 可 
以 自然 地 假定 它 的 相 邻 两 代数 量 之 比 与 寄主 数量 成 正比 . 建立 一 个 寄主 -寄生 模型 研究 
二 者 数量 变化 的 规律 ,讨论 时 间 充 分 长 以 后 的 趋势 . 

模型 及 其 求解 记 第 & 代 寄主 的 种 群 数量 为 =, ,最 大 容量 为 N, 固 有 增长 率 为 r, 寄 
生物 的 种 群 数量 为 y. (4 二 0, 1, 2,…). 按照 上 面 对 寄 主 -寄生 模型 的 假定 ,可 以 写 出 如 下 
的 非 线性 差分 方程 组 ， 


请 XE (IN) QTAYE, (61) 
ye = Orkyk， 
其 中 a, 6 (>0) 是 比例 系数 ,a 反映 寄生 物 由 寄主 那里 抽取 营养 ,从 而 阻 滞 寄主 增长 的 能 
力 ,6 反映 寄主 供养 寄生 物 , 从 而 使 寄生 物 增 长 (或 减少 ) 的 能 力 .… 

设 定 一 组 参数 ; 寄主 zs 的 最 大 容量 N 一 100, 固 有 增长 率 "一 1.5, 寄 生物 在 最 好 的 条 
件 下 每 代 的 数量 可 以 翻 一 番 , 即 zx 一 N 时 ye 二 2， 于 是 ON 三 2,0 一 2/N 一 0.02,a 略 大 
于 5, 设 <=0.025. 下 面 令 初始 值 zo 二 50,yo 一 10, 用 MATLAB 对 模型 (61) 做 计算 ,程序 
如 下 ,结果 只 给 出 图 形 ( 图 2. 10). | 


function z= exf13(x0,y0,n,r,N,a,b) % 建立 名 为 exf13 的 函数 M 文件 ,各 参数 可 调节 


2.5 数值 微分 


x= x0;y= y0; % 赋 初 值 

for k=1:n 
XxCk 二 1) 二 xCk) 十 rx xCk) x (1 一 xCk)/N) 一 axxCk) x yk); % 按照 (61) 式 迭代 计算 
y(k+1)= bx xCk) x* y(k); 

end 

z= [x',y'j; 


z==exf13(50,10,100,1.5,100,0.025,0.02); % 给 定 参 数值 ,调用 exf13 计算 
k=0 : 100; 
plotCk,zC :; ,1),k,z( : ,2)), grid % 作 xk ,yi 的 图 形 
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图 2.10 给 定 参 数 下 模型 (61) 的 结果 
从 图 2. 10 可 以 看 出 ,k 充分 大 以 后 ze, 闪 旦 略 有 衰减 的 振 葛 趋势 , zx, 闪 分 别 在 50 和 


30 附近 振 葛 (& 取 1000,2000,…, 这 个 趋势 看 得 更 清楚 ). 
在 差分 方程 组 (61) 中 令 二 Zl 二 ZX; 二 Yeti 二 y, 得 到 3 个 平衡 点 : (ge y) 二 (0， 


0),(N, 0),( 寺 ,二 (1 一 遍 )). 显 然 ,只 有 第 3 个 才 是 寄主 -寄生 物 共存 的 平衡 点 ,将 所 给 
参数 代入 可 知 这 个 平衡 点 正 是 (x, y) 一 〈50，30)， 


2.5 数值 微分 
数值 微分 是 用 离散 方法 近似 地 计算 函数 y= f(z) 在 某 点 z=a 的 导数 值 . 当然 ,通常 


仅 当 函数 以 离散 数值 形式 给 出 时 才 有 这 种 必要 . 根据 导数 定义 可 以 用 差 商 近似 微 商 ( 导 
数 ) ,有 
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f (a) 之 (64) 


称 中 点 公式 ,这 是 最 常用 的 . 
(62) 式 一 (64) 式 的 几何 意义 可 由 图 2. 11 看 出 ,f(a) 是 切线 AT 的 斜率 ,而 前 差 、 后 

差 公式 和 中 点 公式 的 右 端 分 别 是 割 线 AB, AC 和 BC 的 | 和 

斜率 ,显然 BC 的 斜率 更 接近 AT 的 斜率 , 即 (64) 式 的 精 

度 更 高 . 
为 了 估计 这 些 近似 公式 的 精度 ,将 Fa 十 太 和 Fa 一 和 

在 点 & 作 泰勒 (Taylor) 展 开 
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人 a-h QH 万 3 
(65) 图 2.11 前 差 . 后 差 公式 和 中 点 
将 上 式 代 入 (62) 式 一 (64) 式 可 知 ,(62) 式 和 (63) 式 的 误 公式 的 几何 意义 


差 为 OC(h), 而 (64) 式 的 误差 为 OCh?). 


当 函 数 y 王 f(z) 在 等 间距 为 的 分 点 zo 过 zi 过 … 达 zx 上 用 离散 数值 表示 为 yo， 
yi 时 ， 函数 在 分 点 Xl ，,"… Ts-1 的 导数 值 可 由 中 点 公式 (64) 计 算 : 


f(z) EH, hl,2, nl. | (66) 


对 于 端点 zo ,zi ,与 (66) 式 相 适 应 的 计算 公式 为 
| f (zo) 二 3 A 二 站 》 

(66) 式 ,(67) 式 统称 三 点 公式 ,其 误差 为 OC(h?). 

前 差 公式 (间距 二 1) 可 由 MATLAB 中 的 命令 diff(z) 来 实现 ,输入 zx 是 n 维 数 
组 ,输出 为 n—1 维 数组 [zs 一 2 AT3 2 ee 

例 ”人口 增长 率 

已 知 20 世纪 美国 人 日 统计 数据 如 表 2.8, 计 算 表 中 这 些 年 份 的 人 口 年 增长 率 ， 

表 2.8 1900 一 2000 年 美国 人 口 统计 数据 


四 下 
年 份 1900 1910 1920 | 1930 | 1940 | 1950 | 1960 ] 1970 ] 1980 | 1990 2Q000 
| | 


-2 一 yi 十 3y， 


/oY 
f (x,) 一 2 


(67) 


92.0 | 106.5 123.2 |131.7 | 150.7 179.3 | 204.0 226.5 |251.4| 281.4 


车 记 时 刻 + 的 人 口 为 z(D , 则 人 口 (相对 ) 增 长 率 为 (六 一 5 


,表示 每 年 人 口 增 长 
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的 比例 . 对 于 表 2. 8 给 出 的 人 口 数据 , 记 1900 年 为 k= 二 0,1910, 1920,，…,2000 年 依次 为 
& 一 1，2,，…，10,R 年 人 口 记 为 zk， 年 增长 率 为 r， 用 数值 微分 的 三 点 公式 计算 (将 10 年 
增长 率 变 为 年 增长 率 , 故 A=10), 有 


7 二 sas 
Py 20xx 9 k Ls2., 39y 
本 一 3zo 十 4zl 一 Ts _ Xs 一 4zo 十 3zio 
20zxo k 9 0 20zio “ 


编程 计算 得 到 的 结果 如 表 2. 9. 


表 2.9 美国 人 口 的 年 增长 率 


年 份 
r/% | 2.20 1.66 


| 1900 


可 以 看 出 ,20 世纪 美国 人 口 增长 率 总 的 来 说 在 下 降 ,但 是 有 起 伏 ,30 年 代 和 第 二 次 世 
界 大 战 时 期 人 口 增长 率 显著 下 噬 , 战 后 又 迅速 上 升 ,20 世纪 后 期 稳定 在 1% 多 一 点 . 


2.6 实验 练习 


1, 练习 用 差分 方程 建立 离散 动态 过 程 的 数学 模型 ,并 用 MATLAB 计算 其 数值 解 ; 

2. 了 解 差分 方程 平衡 点 及 其 稳定 性 的 基本 知识 ; 

3， 练习 数值 微分 的 计算 ， 

1. 某 人 从 银行 贷款 购房 , 若 他 今年 初 贷款 10 万 元 ,月 利率 0.5% ,每 月 还 1000 元 , 建 
立 差分 方程 计算 他 每 年 末 欠 银行 多 少 钱 , 多 少时 间 才 能 还 清 ? 如 果 要 10 年 还 清 , 每 月 需 
还 多 少 ? 

”2. 一 老人 60 岁 时 将 养老 金 10 万 元 存 人 基金 会 ,月 利率 0.4% ,他 每 月 取 1000 元 作 
为 生活 费 ,建立 差分 方程 计算 他 每 岁 末 尚 有 多 少 钱 ? 多 少 岁 时 将 基金 用 完 ? 如 果 想 用 到 
80 岁 , 问 60 岁 时 应 存 人 多 少 钱 ? 

3. 某 湖泊 每 天 有 10'm 的 河水 流入 ,河水 中 污 物 浓度 为 0. 02g/m’ ,经 渠道 排水 后 湖 
流 容 积 保持 200X10'm 不 变 , 现 测定 湖泊 中 污 物 浓度 为 0. 2 g/m ,建立 差分 方程 计算 湖 
泊 中 1 年 内 逐 月 (每 月 按 30 天 计 ) 下 降 的 污 物 浓 度 , 问 要 多 长 时 间 才 能 达到 环保 要 求 的 浓 
度 0.04 g/m’? 为 了 把 这 个 时 间 缩 短 为 1 年 ,应 将 河水 中 污 物 浓度 降低 到 多 少 ? 

4. 某 日 站 晨 一 住所 发 生 一 件 凶 杀 案 ,警方 于 6 时 到 达 现 场 后 测 得 尸 温 26C ,室温 
17%C ,2 小 时 后 尸 温 下 降 了 3C , 试 根据 冷却 定律 建立 差分 方程 ,估计 凶杀 案 发 生 的 时 间 
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实验 2 差分 方程 和 数值 微分 
(可 设 正常 体温 为 37'C). . 

5. 据 报道 , 某 种 山猫 在 较 好 、 中 等 及 较 差 的 自然 环境 下 ,年 平均 增长 率 分 别 为 
1. 68% ,0.55% 和 一 4. 50% ,假定 开始 时 有 100 只 山猫 , 按 以 下 情况 讨论 山猫 数量 逐年 变 
化 过 程 及 趋势 : 

(1) 3 种 自然 环境 下 25 年 的 变化 过 程 ( 作 图 ); 

(2) 如 果 每 年 捕获 3 只 ,会 发 生 什么 情况 ? 山猫 会 灭绝 吗 ? 如 果 每 年 只 捕获 1 只 呢 ? 

(3) 在 较 差 的 自然 环境 下 ,如果 想 使 山猫 数量 稳定 在 60 只 左右 ,每 年 要 人 工 繁殖 多 
少 只 ? 

6. 表 2. 10 是 美国 加 州 和 其 他 各 州 1955 年 至 1960 年 人 口 出 生 、 死 亡 和 迁移 (只 考虑 
加 州 和 其 他 各 州 之 间 的 净 迁 移 ) 的 情况 (单位 : 千 人 ) ,根据 这 些 数据 建立 差分 方程 模型 ， 
计算 并 预测 直至 2010 年 的 人 口 状况 . 

(1) 以 加 州 和 其 他 各 州 的 人 口 数量 为 对 象 . 

(2) 以 加 州 和 其 他 各 州 在 美国 总 人 口中 的 比例 为 对 象 , 观 察 趋势. 


表 2.10 美国 加 州 和 其 他 各 州 人 口 状况 


1955 年 人 口 | 1955 一 1960 年 | 1955 一 1960 年 | 1955 一 1960 年 | 1960 年 人 口 
/ 千 人 出 生 人 数 / 千 人 | 死亡 人 数 / 千 人 | 迁移 人 数 / 千 人 /于 人 


加 州 12988 1708 614 1124 
其 他 各 州 152082 19499 一 1124 163040 
总 数 165070 21207 178246 


7. 与 蛛网 模型 稍 有 差别 , 设 第 & 十 1 与 & 时段 商 品 上 市 数量 之 差 是 第 & 时 段 价格 的 
线性 增 函 数 ,系数 为 a; 第 十 1 与 上 时 段 商 品 价格 之 差 是 第 & 时 段 数量 的 线性 减 函数 , 系 
数 为 0. 又 已 知 当 商品 数量 为 500、 价 格 为 200 时 ,处 于 平衡 状态 . 建立 差分 方程 模型 描述 
商品 数量 和 价格 的 变化 规律 ,对 以 下 情况 作 图 讨论 其 变化 趋势 . 

(1) 设 4a 二 0.2,6 二 0.1, 开 始 时 商品 数量 和 价格 分 别 在 500 和 100 附近 . 

(2) 利用 特征 根 讨 论 变化 趋势 . 

8. 在 某 种 环境 下 猫 头 应 的 主要 食物 来 源 是 田鼠 , 设 田鼠 的 年 平均 增长 率 为 x , 猫 头 
订 的 存在 引起 的 由 鼠 增长 率 的 减少 与 猫头鹰 的 数量 成 正比 ,比例 系数 为 ai; 猫 头 应 的 年 
平均 减少 率 为 关 ; 田 鼠 的 存在 引起 的 猫 头 应 减少 率 的 增加 与 四 鼠 的 数量 成 正比 ,比例 系 
数 为 az. 建立 差分 方程 模型 描述 田鼠 和 猫 头 座 共 处 时 的 数量 变化 规律 ,对 以 下 情况 作 图 
给 出 50 年 的 变化 过 程 . 

(1) 设 放 二 0. 2,rs 二 0.3,ai 二 0.001,az 二 0. 002, 开 始 时 有 100 只 田鼠 和 50 只 猫 


2.6 实验 练习 


(2) ni,rz,a1,;4z 同 上 ,开始 时 有 100 只 田鼠 和 200 只 猫 涉 认 . 

(3) 适当 改变 参数 a ,a; (初始 值 同 上 ). 

(4) 求 差分 方程 的 平衡 点 ,它们 稳定 吗 ? 

9. 研究 将 鹿 群 放 人 草场 后 草 和 鹿 两 种 群 的 相互 作用 . 章 的 生长 遵从 Logistic 规律 ， 
年 固有 增长 率 0.8, 最 大 密度 为 3000( 密 度 单 位 ), 在 草 最 茂盛 时 每 只 鹿 每 年 可 吃 掉 1. 6 
(密度 单位 ) 的 草 . 车 没有 草 , 鹿 群 的 年 死亡 率 高 达 0.9, 而 草 的 存在 可 使 诈 的 死亡 得 以 补 
尝 ,在 草 最 茂盛 时 补偿 率 为 1. 5. 作出 一 些 简化 假设 ,用 差分 方程 模型 描述 草 和 鹿 两 种 群 
数量 的 变化 过 程 ,就 以 下 情况 进行 讨论 . 

(1) 比较 将 100 只 鹿 放 人 密度 为 1000 和 密度 为 3000 的 草场 两 种 情况 ， 

(2) 适当 改变 参数 ,观察 变化 趋势 . 

10. 某 居 民 小 区 有 一 个 直径 10m 的 圆柱 形 水 塔 ,每 天 午夜 24 时 向 水 塔 供水 ,此 后 每 
隔 2h 记录 水 位 ,如 表 2. 11, 计 算 小 区 在 这 些 时 刻 每 小 时 的 用 水 量 . 

表 2.11 水 位 记录 
时 刻 /h 
水 位 /cm 


24 
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插值 与 数值 积分 


插值 是 和 拉 格 朗 晶 (Lagrange)、 牛顿 (Newton) .高 斯 (Gauss) 等 著名 数学 家 的 名 字 连 
在 一 起 的 , 它 最 初 来 源 于 天 体 计算 的 需要 ,比如 ,人 们 得 到 了 若干 观测 值 , 即 某 个 星球 在 若 
干 已 知 时 刻 的 位 置 ,需要 计算 星球 在 另 一 些 时 刻 的 位 置 . 所 谓 插值 ,通俗 地 说 就 是 ,在 若干 
已 知 的 函数 值 之 间 插入 计算 一 些 未 知 的 函数 值 . 插值 在 诸如 机 械 加 工 等 工程 技术 和 数据 
处 理 等 科学 研究 中 有 着 许多 直接 的 应 用 ,插值 还 是 数值 积分 .微分 方程 数值 解 等 数值 计算 
的 基础 . 

积分 是 我 们 在 高 等 数学 中 学 过 的 一 个 最 基本 的 运算 ,也 是 一 些 非常 重要 的 数学 工具 
如 微分 方程 .概率 论 等 的 基础 ,在 实际 问题 中 也 有 着 许多 直接 的 应 用 . 尽管 我 们 学 了 不 少 
积分 运算 的 方法 ,做 了 大 量 习题 ,可 是 仍 有 许多 函数 “ 积 不 出 来 ", 即 使 是 非常 简单 的 题目 ， 


如 求 不 定 积分 |e dz,| (sinz/z)dz ,因为 它们 的 原 函 数 无 法 由 基本 初等 函数 经 过 有 限 


次 四 则 及 复合 运算 构成 ,计算 这 种 类 型 的 定 积 分 就 只 能 用 数值 方法 . 至 于 由 离散 数据 或 图 
形 表 示 的 隔 数 的 定 积分 ,理所当然 地 属于 数值 积分 的 范畴 . 

以 下 3.1 节 提出 几 个 经 过 简化 的 实际 问题 及 其 数学 模型 ,3. 2 节 介 绍 3 种 插值 方 
法 一 一 拉 格 朗 日 多 项 式 插值 .分 段 线性 插值 和 三 次 样 条 插值 ,3. 3 节 介 绍 数值 积分 的 梯形 
公式 .辛普森 (Simpson) 公 式 高 斯 (Gauss) 公 式 ,3.4 节 布置 实验 练习 ， 


3.1 实例 及 其 数学 模型 


3.1.1 数控 机 床 加 工 零件 


问题 ” 待 加 工 零 件 的 外 形 根据 工艺 要 求 由 一 组 数据 (zx, y) 给 出 (在 平面 情况 下 ) ,用 
数控 机 床 加 工时 刀具 必须 沿 这 些 数据 点 前 进 ,并 且 由 于 刀具 每 次 只 能 沿 z 方向 或 y 方向 
走 非常 小 的 一步 ,所 以 需要 将 已 知 数据 加 密 , 得 到 加 工 所 要 求 的 步 长 很 小 的 (z，y) 坐 标 . 

3. 1 是 待 加 工 零件 的 轮廓 线 , 表 3. 1 给 出 了 轮廓 线 上 x 每 间隔 0. 2( 长 度 单位 ) 的 
加 工 坐标 zx，y( 顺 时 针 方向 为 序 , 由 轮廓 线 的 左右 对 称 性 , 表 中 只 给 出 右 半 部 的 数据 ). 候 


-2 
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5 02 3 4 
图 3.1 零件 的 轮廓 线 {x 间隔 0.2) 


3. 1 


实例 及 其 数学 模型 


设 震 要 得 到 工 或 y 坐标 每 改变 0.05 时 的 坐标 , 试 完 成 加 工 所 需 的 加 密 数 据 , 画 出 曲线 . 


表 3.1 x 间隔 0.2 的 加 工 坐 标 x,y( 图 3.1 右 半 部 的 数据 ) 
0.0, 5.00 0.2, 4.71 0.4, 4.31 0.6, 3.68 0.8, 3.05 1.0, 2.50 1.2, 2.05 
. 1.4, 1.69 1.6, 1.40 1.8, 1.18 2.0, 1.00 2.2, 0.86 2.4, 0.74 2.6, 0.64 
2.8, 0.57 3.0, 0.50 3.2, 0.44 3.4, 0.40 3.6, 0.36 3.8, 0.32 4.0, 0.29 
4.2, 0.26 4.4, 0.24 4.6, 0.20 4.8, 0.15 5.0, 0.00 |4.8, —1.40| 4.6, 一 1.96 
一 才 一 一 
4.4， 一 2.37 |4.2,， 一 2.71 | 4.0, —3.00|3.8, 一 3.25 | 3.6， 一 3.47 | 3.4， 一 3.67 | 3.2, 一 3. 84 
3.0, —4.00 12.8, 一 4.1412.6， 一 4.27 | 2.4， 一 4.39 | 2.2， 一 4.49 |2.0， 一 4.58 | 1.8， 一 4.66 
1.6, —4.74 |1.4, —4.80 | 1.2， 一 4.85 |1.0， 一 4.90 |0.8,， 一 4.94 10.6， 一 4.96 | 0.4， 一 4.98 
一 一 
0.2， 一 人. 99 0.0， 一 5.00 


模型 ” 若 直 接 利 用 表 3. 1 的 数据 加 密 ,为 得 到 经 过 这 些 点 的 曲线 , 需 将 零件 轮廓 线 
的 右 半 部 分 为 y 之 0 和 y<0 两 部 分 ,分 别 计 算 两 个 ( 单 值 ) 函 数 在 加 密 点 ( 即 插值 点 ) 的 
值 , 还 要 设法 保证 连接 点 处 的 光滑 性 . 另 一 种 办 法 是 将 图 3. 1 逆 时 针 方 向 转 90° ,轮廓 线 上 
下 对 称 ,于 是 只 需 对 上 半 部 计算 一 个 函数 在 插值 点 的 值 即 可 . 我 们 在 3. 2 节 继 续 讨论 这 个 
问题 


3.1.2 卫星 轨道 长 度 
问题 “人造 地 球 卫 星 轨道 可 视 为 平面 上 的 椭圆 . 我 国 第 ~- 颗 人 造 地 球 卫星 近地点 距 
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地 球 表面 439km, 远地点 距 地 球 表面 2384km ,已 知 地 球 半 径 为 6371km, 求 该 卫星 的 轨道 
长 度 . | ; 

模型 ”卫星 轨道 的 示意 图 如 图 3.2,a, 5 分 别 是 椭圆 轨道 的 长 半 轴 和 短 半 轴 ,地 球 位 
于 椭圆 的 一 个 焦点 处 ,焦距 为 c, 地 球 半径 为 x， 
近地点 和 远地点 与 地 球 表面 的 距离 分 别 是 s 和 
2 .由 图 3.2 可 知 ，2a 一 5 十 s 十 27r,c 一 a 一 5 一 r， 
由 椭圆 性 质 5 二 Va? 一 ,将 5 ，s，r 的 数据 代 
入 以 上 各 式 得 4a 二 7782. 5km,6 二 7721. 5km. 

椭圆 的 参数 方程 为 x 二 acosi,y 二 bsint (0 过 
魏 2xr) ,根据 计算 参数 方程 弧 长 的 公式 ,椭圆 长 度 
可 表 为 如 下 积分 : 


x/2 
r=4| (azsin2z + bcos dt (1) 
0 


它 称 为 椭圆 积分 ,无 法 用 解析 方法 计算 ,我 们 将 
在 3. 3 节 继续 讨论 这 个 问题 . 


3.2 3 种 插值 方法 


插值 问题 的 提 法 是 ,已 知 n 十 1 个 节点 (zi ;yj)《(j 王 0,1,…,n), 其 中 Tj 互 不 相同 ,不 
妨 设 4 二 zo 过 zi 过 … 过 x, ==6, 求 任 一 插值 点 z* (天 zh) 处 的 插值 y* ,节点 (zx; ,yj) 可 以 看 
成 是 由 某 个 孙 数 y 二 glz) 产 生 的 ,g 的 解析 表达 式 可 能 十 分 复杂 ,或 不 存在 解析 形式 ,只 
是 由 节点 给 出 的 离散 数据 . 

求解 的 基本 思路 是 ,构造 一 个 相对 简单 的 函数 y 三 f(x) , 称 为 插值 函数 ,使 f 通过 全 
部 节点 , 即 f(x) 二 yj Cj 二 0,1,…,n), 再 用 f(x) 计算 插值 , 即 y* = f(zx* ). 

本 节 介 绍 3 种 基本 的 、 常 用 的 插值 : 拉 格 朗 日 多 项 式 插值 .分 段 线 性 插值 和 三 次 样 条 
插值 . 


3.2.1 拉 格 朗 日 多 项 式 插 值 


1. 拉 格 朗 日 插值 多 项 式 | 
从 理论 和 计算 角度 看 ,多 项 式 是 最 简单 的 函数 , 设 插值 函数 是 ”次 多 项 式 , 记 作 
L(xz) 一 az 十 az 十 十 az 十 ao. (2) 


图 3.2 卫星 轨道 的 示意 图 


对 于 节点 Cz; ;yj) 应 有 . 
L,(z;) = y)，, 7 一 0,1,.,n, (3) 
为 了 确定 插值 多 项 式 L, (z) 中 的 系数 aa ，… ,40 ,将 (2) 式 代 和 人 (3) 式 ,有 
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ai 十 aiz 扩 十 … 十 axzo 十 ao 二 yo， 
| cg 
az 十 QZ 十 … 十 az 十 ao = y,. 
记 
mh EY ss 
发 一 | : | @ 一 (aa pa) 一 (yo 
A er 
方程 组 (4) 简 写作 
: Xa = y, | | (5) 


其 中 六 的 行列 式 det(X) 是 范 德 蒙 德 (Vandermonde) 行 列 式 , 利 用 行列 式 性 质 可 得 
det(X) 一 一 [Il (x = 


因 zx; 互 不 相同 , 故 det(X) 关 0, 于 是 方程 组 (5) 中 a 有 惟一 解 , 即 通 过 n 十 1 个 节点 (z 坐标 
互 不 相同 ) 的 次 多 项 式 有 曲线 可 以 惟一 地 确定 . 
实际 上 比较 方便 的 做 法 不 是 解 方程 组 (5) 求 a, 而 蚌 先 构造 一 组 基 油 数 : 
(TO— x0) (rT TT Xa) (rT x) | 
(zi— xo) (Tim Ze) Ti — TH) (Ti — x) 


容易 看 出 ,n 次 多 项 式 1;(x) 满 足 


li(X) 一 i 二 0,1l,%,n. (6) 


1， 工 二 7 . 
li(zx;) 一 iyj = 0,1,° ,Nn, 
0，i 关 jj， 
令 
L(x) 一 2130i(z)， (7) 
i=0 


显然 L(x) 是 满足 (3) 式 的 nn 次 多 项 式 . 由 方程 组 (5) 解 的 惟一 性 , (6) 式 (7) 式 就 是 我 们 
要 寻求 的 插值 函数 , 称 为 拉 格 朗 日 插值 多 项 式 .用 L, (zx) 计算 插值 称 拉 格 朗 日 多 项 式 
插值 . 

(1) 对 于 十 1 个 节点 ,车 用 次 数 大 于 或 小 于 7 的 多 项 式 作 插 值 ,结果 如 何 ? 

(2) 由 十 1 个 节点 得 到 的 L, (zx) 的 次 数 会 不 会 小 于 n? 试 就 7 = 2 的 情况 加 以 
说 明 . | 

(3) 若 g(z) 为 m 次 多 项 式 ,m 二 n, 问 L(x) 与 g(x) 关系 如 何 ? 

2. 误差 估计 

对 于 任意 的 插值 点 x€ La,6, 插 值 的 误差 定义 为 插值 多 项 式 L, (xz) 与 产生 节点 (x)， 
yj) 的 g(x) 之 差 , 记 作 R,(z). 虽然 我 们 可 能 不 知道 g(x) 的 解析 表达 式 , 但 是 如 果 g(z) 充 
分 光滑 ,不 妨 设 具有 2 十 1 阶 导 数 , 则 可 以 证 明 ( 略 ): 
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a 加 gD (CE) 
R,(x) = g(x) 一 工 ,( 工 ) GFDIl Xi;), €€ (a,b), (8) 
车 gx) 满足 
| go 8) |< Mn (9) 
则 
Mi 二 
| R,(z) < | zz |. (10) 


实际 上 ,因为 M+1 常 难以 确定 ,所 以 (10) 式 并 不 能 给 出 精确 的 误差 估计 ,但 是 可 以 粗 
略 地 看 出 ,插值 点 zx 越 接近 节点 zi，|R,(Cz)| 越 小 ;g 平缓 使 高 阶 导数 越 小 ,|R, (zx) | 越 小 ; 
nn 增加 ,可 能 使 |R, (zx)| 减 少 . 

例 1 用 函数 y 王 g(x) 二 sin(xz/2) 在 [0,1j] 区 间 上 等 距 地 产生 x 十 1 个 节点 , 当 二 


”1,.2,… 时 考察 拉 格 朗 日 插值 多 项 式 L, (zx) 的 误差 . 


由 (6) 式 ,(7) 式 容易 得 到 ,n 二 1 时 插值 函数 为 直线 Li (xz) 二 z+,n 二 2 时 插值 函数 为 二 
次 曲线 Li(z)== 一 (2V2 一 2)z 十 (2 V2 一 1)z. 


合计 |R,(z)|: 对 于 g(x) 二 sin(xz/2), 取 Mri 二 《x/2)"t!. 记 节点 间隔 为 1 一 一 ， 当 
人 2 
和 (ziyZi+l) 时 ， |z—z; | | TT Xitl |< 要， 即使 对 于 最 坏 的 情况 如 rE (zxo，T1), 也 有 


n Fr . 
II | 工 一 并 [一 二 2h，。3h。…。zmk, 于 是 (10) 式 给 出 
j=6 


1 /x oh 
[Rn) < Dr) 4 
可 以 算出 
n | 1 | 2 | 3 4 
|R, (Cz)| 0.3 .0.04 4.7X10™ 4.7X107+ 


3. 插值 多 项 式 的 振荡 

用 拉 格 朗 日 插值 多 项 式 L, (z) 近 似 g(z)(a 委 z 委 0) , 随 着 节点 个 数 的 增加 ,L, (xz) 的 
次 数 n 变 大 ,多 数 情 况 下 误差 |R (zx) | 会 变 小 .但 是 增加 时 ,由 于 工 ,(z) 的 起 伏 增加 ,有 
时 会 出 现 很 大 的 振荡 . 龙 格 (Runge) 给 出 了 一 个 有 名 的 例子 : 


g(z) 一 Ta， 一 "5D 生 工 志 5. (11) 
将 [一 5,5] 区 间 ”等 分 (2 = 2,4,6,…), 用 glx) 产生 xn 十 1 个 节点 , 求 出 拉 格 朗 日 插值 多 
项 式 L, (x) ,会 得 到 如 图 3. 3 的 结果 . 可 以 看 出 , 随 着 n 的 增 大 ,对 于 较 小 的 |z| ,LL, (xz) 与 


g(X) 的 误差 越 来 越 小 ;而 对 于 较 大 的 |z| ,L,(z) 振 荡 越 来 越 大 ,与 8(z) 的 误差 自然 也 越 


下 
二 

上 
上 
和 
下 
下 
We 
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来 越 大 . 这 种 振荡 称 为 龙 格 现象 . 

事实 上 可 以 证 明 , 仅 当 |z| 委 3.63 时 , 才 有 limL,(7x) 王 g(7x) ,在 此 区 间 外 ,L,(z) 是 发 
散 的 . 

高 次 插值 多 项 式 的 这 些 缺陷 ,促使 人 们 转 而 寻求 简单 的 低 次 多 项 式 插 值 . 


图 3.3 g(x) 二 1/(1 十 x?) (虚线 ) 的 拉 格 朗 日 插值 曲线 Lv (x) 


3.2.2 分 段 线性 插值 


简单 地 说 ,将 每 两 个 相 邻 的 节点 用 直线 连 起 来 ,如 此 形成 的 一 条 折线 就 是 分 段 线性 插 
值 函 数 ,如 图 3.4, 记 作 I,(x), 它 满足 1(x;) 二 yj;, 且 1, (xz) 在 每 个 小 区 间 [zx; ,xj+1] 上 是 
线性 函数 (j= 二 0,1,…,n). . 

I, 《Xz) 可 以 表示 为 | 


a 


L(x) = > ylj(z), (12) 
j=0 
XTX! ee j = 0 舍 去 ， 1 


= : Xj~l 过 之 SS 1 O 六 jy Xl 
Xi Xi-l , 1 


图 3.4 分 段 线性 插值 示意 图 


1 
! 
| 

» 1 
| 
| 


1 
1 
1 
1 
1 
1 
1 
1 
和 
x 


lj (Xx) = ss Xj TR Xi 7 三 使 去 ， 
12; Tjtl 
0， 其 他 . 

(13) 


DCz) 有 和 良好 的 收敛 性 , 即 对 于 x€E La,b] 有 liml, (zx) 二 g(x). 
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用 了 (Cz) 计算 z 点 的 插值 时 ,只 用 到 z 左右 的 两 个 节点 ,计算 量 与 节点 个 数 无关 . 


但 是 越 大 ,分 段 越 多 ,插值 误差 越 小 . 实际 上 用 函数 表 作 插值 计算 时 ,分 段 线性 插值 就 足 


够 了 ,如 数学 物理 中 用 的 特殊 函数 表 ,数理 统计 中 用 的 概率 分 布 表 等 . 
3.2.3 三 次 样 条 插值 


1. 样 条 函数 的 由 来 
分 段 线 性 插值 虽然 简单 ,n 足够 大 时 精度 也 相当 高 ,但 是 折线 在 节点 处 显然 不 光滑 ， 
即 志 (Cz) 在 节点 处 导数 不 存在 . 这 影响 了 它 在 需要 光滑 插值 曲线 的 (如 机 械 加 工 等 ) 领 域 ， 
中 的 应 用 . 
所 谓 样 条 (spline) ,来 源 于 船舶 .飞机 等 设计 中 描绘 光滑 外 形 曲 线 用 的 绘图 工具 . 一 
根 有 弹性 的 细 长 木 条 用 压 铁 固 定 在 节点 上 ,其 他 地 方 让 它 自然 弯曲 ,如 此 画 出 的 曲线 称 为 
样 条 曲线 . 因为 这 种 曲线 的 曲率 是 处 处 连续 的 ,所 以 要 求 样 条 函数 的 二 阶 导 数 连续 . 人 们 
普遍 使 用 的 样 条 函数 是 分 段 三 次 多 项 式 . 
2. 三 次 样 条 函数 
三 次 样 条 函数 记 作 SC(zx) Caz 二 0). 要 求 它 满足 以 下 条 件 : 
(1) 在 每 个 小 区 间 [zi_1 ,zij(i 二 1,…,n) 上 是 三 次 多 项 式 ; 
(2) 在 c< 委 z 委 /上 二 阶 导 数 连续 ; 
(3) S(z;)= yi;, (1=0,1,.… ,7n). (14) 
由 条 件 (1) ,不 妨 将 SCz) 记 为 
SGCz) 一 (SICz)zE[Lzz]i = ln)}, Sz) 一 az 十 pz2 十 cz 十 di， 
(15) 
其 中 ai,b; ,ci;di 为 待定 系数 , 共 4n 个 .由 条 件 (2)， 
I = Si Zi), 
SI(z;) = Sr), i=1,2,,n—1. (16) 
[ew = Stn (zi)， 
容易 看 出 ,(14) 式 ,(16) 式 共 含 有 4n 一 2 个 方程 ,为 确定 SCz) 的 4n 个 待定 参数 , 尚 需 
再 给 出 两 个 条 件 . 在 实际 应 用 中 通常 有 以 下 三 种 类 型 的 端点 条 件 作为 附加 条 件 . 
第 一 类 ”给 定 两 端点 的 一 阶 导数 SCzo),S (x,); 
第 二 类 ”给 定 两 端点 的 二 阶 导数 S (zo),S (xz,) ,最 常用 的 是 所 谓 自然 边界 条 件 : 
Sx0) = Sr,) =: 0. (17) 
第 三 类 ”对 于 周期 水 数 , 即 两 端点 已 经 满足 SCxo) 王 SCz) 时 , 令 它 们 的 一 阶 导 数 
二 阶 导 数 分 别 相 等 , 即 SCzo) 王 SCz),S Czo) 三 SCz), 称 为 周期 条 件 . 
可 以 证 明 ,4z 元 线性 方程 组 (14),(16),(17) 有 惟一 解 , 即 SCz) 被 惟一 确定 . 在 实际 
计算 时 需要 设计 简便 的 解法 . 
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像 分 段 线性 渔 数 I,(z) 一 样 ,三 次 样 条 函数 SCz) 也 有 良好 的 收敛 性 , 即 在 相当 一 般 
的 条 件 下 ,limS(z) 二 g(xz). 


3.2.4 用 MATLAB 做 插值 计算 


拉 格 朗 日 插值 ” 需 先 按照 (6) 式 (7) 式 编写 一 个 函数 M 文件 ,名 为 lagr.m 
设 2 个 节点 以 数组 x0,y0 输入 (注意 : 程序 中 用 个 节点 ,而 不 是 前 面 所 说 的 n 十 1 
. 个 节点 ),m 个 插值 点 以 数组 x 输入 . 输出 数组 y 为 m 个 插值 . 


function y= lagr(x0,y0,x) 
n= length(x0); m= length(x) ; 


for i=1:m 
z= x(D); 
s=0; 
for k=1:n 
p=1; 
for j=1:n 
放 j 全 三 K 
p=px (z—x00))/(x0k) 一 x0(j) 7); 
end 
end 
s=p* y0(Ck) 十 Si; 
end 
yO)=s; 
end 


做 拉 格 朗 日 插值 计算 时 只 需 在 输入 x0,y0, x 后 运行 命令 y= lagr(x0,y0,x) 即 可 . 
分 段 线性 插值 MATLAB 中 有 现成 的 命令 


y= interp1(x0,y0, x) 


其 中 x0,y0 为 节点 数组 ( 同 长 度 ) ,x 为 插值 点 数组 ,y 为 插值 数组 . 
三 次 样 条 插值 MATLAB 中 有 现成 的 命令 


y= interp1(x0,y0,x,'spline') 
或 
y= spline(x0 ,y0 ,x) 


其 中 x0,y0 为 节点 数组 ( 同 长 度 ) ,x 为 插值 点 数组 ,y 为 插值 数组 ,端点 为 自然 边界 条 件 . 
spline 命令 还 可 处 理 上 述 第 一 类 端点 条 件 , 只 需 将 原来 的 输入 数组 y0 改 为 yy0 = 
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[a y0 b], 其 中 a,b 分 别 为 S (zxo),S’(zx,). 
对 出 现 龙 格 现象 的 例子 g(x) 二 1/(1 十 x*) ,将 [一 5,5] 区 间 n( 二 10) 等 分 ,用 g(x) 产 
生 n 十 1( 二 11) 个 节点 ,用 MATLAB 做 以 上 三 种 方法 的 插值 计算 ,进行 比较 . 编程 如 下 : 


x0 一 一 5 :5; 

y0=1./(1+x0.°2); % 产生 节 : 点 《x0,y0) 
x=—5:0.1:5; % 产生 插值 点 x, 间隔 0.1 
y=1./(1+x.°2); % 计算 g(x) 用 于 比较 

y1= lagr(x0,y0,x); , % 计算 拉 格 朗 日 插值 

y2= interp1(x0,y0,x); % 计算 分 段 线性 插值 

y3= spline(x0,y0 ,x); % 计算 三 次 样 条 插值 

for k=1:11 % 输出 x 之 0 且 间 隔 0.5 的 插值 


xxCk)=x(46+5 x Kk): 
yy(k)=y(46+5 x k); 
yyi(k)=y1(46+5 * k); 
yy2(k)=y2(46+5 x kk); 
yy3Ck)=y3(46+ 5 x k); 


end 

Lxx; yy; yy1; yy2; yy3]' 

z=0xx; % 产生 横 轴 ( 作 图 ) 

plot(x,z, xy k 一 一 xy2，r) % 分 段 线 性 插值 作 图 
pause 

plotCx,z,xsyys'K— —', XxX,y3,'r') % 三 次 样 条 插值 作 图 


输出 的 计算 结果 如 表 3. 2, 其 中 y= 二 g(x) ,yy，ys，y% 依 次 是 拉 格 朗 日 .分 段 线性 、 三 次 样 条 
插值 ,与 精确 值 y 相 比较 ,显然 它们 在 节点 处 相等 ,而 在 插值 点 处 三 次 样 条 插值 的 结果 最 好 . 


表 3.2 g(x)==1/(1 十 忆 )3 种 插值 方法 的 计算 结果 


3.2 3 种 插值 方法 


续 表 
补 了 yi yz ys 
4. 0000 0. 0588 0. 0588 0. 0588 0.0588 
4. 5000 0.0471 1. 5787 0.0486 0.0484 
5. 0000 0.0385 0.0385 0. 0385 0. 0385 


分 段 线性 插值 的 图 形 如 图 3. 5(a) (虚线 为 g(z)) ,三 次 样 条 插值 图 形 如 图 3.5(b)( 播 
值 曲线 与 g(z) 几 乎 重合 ). 


1.0 1.0 
0.9 0.9 
0.8 0.8 上 
0.7 0.7 
0.6 12 
0.5 0.5 
0.4 0.4 
0.3 0.3 LE 
0.2 0.2 
0.1 0.1 
0 0 


-5-4-3-2-10 1 2 3 45 
(b) 三 次 样 条 插值 


-5-4-3-2-10 12 345 
(a) 分 段 线性 插值 


图 3.5 g(x)==1/(1 二 多) (虚线 ) 的 插 信 曲线 


3.2.5 插值 方法 小 结 与 补充 


拉 格 朗 日 插值 是 高 次 多 项 式 插值 (xn 十 1 个 节点 上 用 不 超过 nn 次 的 多 项 式 ) ,插值 曲线 
光滑 ,误差 估计 有 表达 式 , 但 有 振 落 现象 ,收敛 性 不 能 保证 . 这 种 插值 主要 用 于 理论 分 析 ， 
实际 意义 不 大 . 

分 段 线性 插值 简单 实用 ,收敛 性 有 保证 ,但 不 光滑 . 三 次 样 条 插值 的 整体 光滑 性 已 大 
有 提高 ,应 用 广泛 ,但 误差 估计 较 困 难 . 

除 以 上 三 种 插值 外 还 有 下 面 一 些 插值 方 法 ， 

生 顿 均 差 插值 用 拉 格 朗 上 日 插值 , 当 节 点 增加 时 , 原 有 的 基 函 数 均 不 能 再 用 , 需 重新 
计算 . 牛顿 均 差 插值 利用 差分 计算 多 项 式 系数 , 当 节 点 增加 时 ,前面 得 到 的 数据 可 以 利用 ， 
于 是 计算 量 减少 . 当然 ,由 (5) 式 解 的 惟一 性 , 它 与 拉 格 朗 日 插值 的 结果 是 完全 等 价 的 . 

埃 尔 米 特 (Hermite) 插 值 ” 当 实际 问题 不 仅 给 出 节点 的 函数 值 ,而 且 给 出 节点 的 导数 
值 时 , 埃 尔 米 特 插值 多 项 式 可 以 满足 节点 处 函数 、 导 数 均 与 给 定 值 相等 的 要 求 . 由 于 给 定 
值 增加 了 一 倍 ,插值 多 项 式 的 待定 系数 也 要 增加 一 倍 ,于 是 当 节 点 数 为 n 十 1 时 ,可 惟一 确 
定 一 个 次 数 不 超 过 2n 十 1 的 插值 多 项 式 . 

分 段 三 次 插值 和 分 段 三 次 埃 尔 米 特 插值 ”分 段 三 次 插值 比分 段 线性 插值 更 光滑 些 ， 
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在 MATLAB 中 可 直接 用 
y= interp1(x0 ,y0 ,x,'cubic') 


计算 ,其 中 输入 x0,y0,x 和 输出 y 的 含义 与 分 段 线性 插值 相同 . 

分 段 三 次 埃 尔 米 特 插值 是 导数 连续 的 分 段 三 次 多 项 式 , 其 导数 在 节点 处 与 给 定 值 
相等 . 

不 等 距 插值 ”为 了 计算 方便 ,节点 通常 是 等 距 分 布 的 , 称 等 距 插值 . 实际 上 可 以 作 不 
等 距 插 值 ,在 函数 变化 剧烈 处 ,让 节点 密 一 些 ,函数 变化 平缓 处 ,节点 下 一 些 ,这 时 构造 插 
值 函 数 的 原理 与 等 距 搬 值 是 一 样 的 . 

二 维 插值 ”以 上 都 是 一 维 插值 ,插值 函数 是 一 元 函数 (曲线 ). 如 果 在 某 区 域 测量 了 若 
干 个 点 的 高 程 ( 节 点 ), 为 了 画 出 较 精确 的 等 高 线 图 ,要 先 插入 更 多 的 点 (插值 点 ) ,计算 这 
些 点 的 高 程 (插值 ) ,就 是 二 维 插 值 ,插值 活 数 是 二 元 孙 数 (曲面 ). MATLAB 中 有 计算 二 
维 插值 的 程序 ， 


z= interp2 x0, y0 ,2z0 ,x,y) 


读者 可 查阅 MATLAB 帮助 系统 了 解 其 用 法 . 
此 外 ,MATLAB 还 配备 了 专门 的 样 条 工具 箱 (spline toolbox). 


3.2.6 数控 机 床 加 工 零件 ( 续 ) 


按照 3. 1.1 模型 中 提出 的 第 二 种 方法 求解 . 

将 图 3. 1 道 时 针 方向 转 90° ,旋转 后 零件 轮 席 线 的 右 半 部 将 变 成 上 半 部 , 即 图 3. 6(a) 
变 成 图 3. 6(b) ,为 此 只 和 需 令 v= 二 xz, w= 一 y, 则 数据 原来 的 (t，y) 坐 标 变 为 (x, wv) 坐标 . 

在 新 坐标 下 用 分 段 线 性 插值 和 三 次 样 条 插值 方法 计算 (可 试验 用 拉 格 朗 日 插值 ,会 发 
现 振 葛 现象 严重 ) ,编程 如 下 : 

x=[0 :0.2 :5,4.8: —0.2:0]; 

y=[5.00 4.71 4.31 


一 4.98 一 4.99 一 5]; 
v0=x; U0= —y; 
uU=—5:0.05:5; 
v1= interp1(u0 .v0 ,U); 
v2 = spline(y0 ,v0 ,U); 
[Lvl v2 —u] 
subplot(1,3,1) .piotCx,y) ,axis([0 5 —5 5]) 
subplot(t .3,2) ,plotCv1, —u),axis([0 5 —5 5]) 
subpiot(1,3.,3) ,plot(v2. —Uu),axis([0 5 一 5 5]) 


% 按照 表 1 输入 原始 数据 (y 从 简 ) 

% 道 时 针 方 向 转 90 ,节点 Cx, y) 变 为 (u,v) 
% 按 0.05 的 间隔 在 u 方 向 产生 插值 点 

% 在 v 方 向 计算 分 段 线性 插值 

% 在 “方向 计算 三 次 样 条 插值 

% 在 (x，y) 坐 标 系 输出 结果 

% 原 轮廓 线 

% 分 段 线性 插值 的 结果 

% 三 次 样 条 插值 的 结果 


3.2 3 种 插值 方法 


~ 5S 
4.5 
4 
3.5 
3 
> 2.5 
2 
1.5 
1 
0.5 
0 1 2 3,. .4 5 Q 
0.5 1.5 2.5 3.5 4.5 
Xx u 
(a) 原 零件 轮 廊 线 的 右 半 部 (b) 逆 时 针 方向 转 90 "的 结果 


图 3.6 3.1.1 节 的 零件 轮廓 线 


得 到 的 插值 计算 结果 如 表 3. 3, 图 形 如 图 3. 7. 
表 3.3 ”插值 计算 结果 ( 右 半 部 ,x 为 分 段 线 性 插值 ,x 为 三 次 样 条 播 值 ) 


XI Xz > 

4. 9929 | 5.0070 一 0.0500 
0. 0345 | 0.0381 4. 9500 4.9857 | 5.0125 一 0. 1000 
0.0690 0.0747 | 4. 9000 4.9786 5.0165 一 0. 1500 
0. 1034 0. 1097 4. 8500 | 9714 5.0193 一 0. 2000 


0. 1379 0. 1433 4. 8000 
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4 
3 
2 
1 
0 


5+ 0 1 2 3 4 5 


图 3.7 插值 计算 结果 的 图 形 
(从 左 到 右 依 次 为 原 轮廓 线 、 分 段 线性 插值 .三 次 样 条 插值 


3.3 数值 积分 


用 数值 方法 近似 地 求 一 个 函数 f(x) 在 区 间 (a,6) 上 定 积分 1 一 | f(z)dz 的 基本 思 


路 ,可 以 归结 到 定 积分 的 定义 

I= | fC)ar liml,, Le Fe 一， (18) 
充分 大 时 T, 就 是 了 的 数值 积分 .这 里 和 是 第 小 区 间 中 < 的 取 值 ,显然 ,6 取 值 不 同 ， 
数值 积分 1 的 结果 就 不 同 (当然 , 定 积分 1 是 一 样 的 ). 这 种 做 法 相当 于 用 相对 简单 的 阶 
梯 函 数 f(&) (4 二 1,…,n) 代 震 f(zx) 做 积分 . 实际 上 各 种 不 同 的 数值 积分 方法 就 在 于 , 研 


究 用 什么 样 的 简单 函数 代替 f(x) ,使 得 既 能 保证 一 定 的 精度 ,计算 量 又 小 . 
3.3.1 梯形 公式 和 辛普森 公式 


1， 公式 的 导出 

不 妨 设 在 (a,5b) 上 f(z) 之 0, 定 积分 表示 曲线 f(x) 下 的 面积 ,如 何 近 似 计算 这 抉 面 
积 呢 ? (图 3. 8) 

将 (a,6) 区 间 n 等 分 ,h 二 (6b 一 a)/n 称 为 积分 步 长 . 记 a=z6<zi 之 … 之 zi 过 … 过 z= 
6, 庆 一 六 zt)， 在 小 区 间 上 用 矩形 面积 近似 f(x) 下 面 曲 边 梯形 的 面积 ,可 取 左 端点 函数 
值 为 小 矩形 的 高 (图 3.8 中 y= PCz) 曲 线 下 的 虚线 ) ,或 取 右 端点 函数 值 为 小 矩形 的 高 
(图 3.8 中 y= 二 f(x) 曲线 上 的 虚线 ) ,于 是 在 整个 区 间 (4a,6) 内 构成 台阶 形 . 容易 看 出 ,这 两 
个 台阶 形 面积 分 别 为 


3.3 数值 积分 


nl 
Li=hD fs R=hD ft, h= (0— a/n. (19) 
大 一 0 


图 3.8 中 两 个 台阶 形 分 别 小 于 和 大 于 所 求 面 积 . (19) 式 
是 计算 定 积分 的 矩形 公式 . 

若 将 二 者 平均 , 则 每 个 小 区 间 上 的 小 矩形 变 为 小 
梯形 (图 3. 8 中 粗 实 线 ) ,整个 区 间 上 的 结果 为 


1 
,一 2 ft ft fi h= (6—a)/n. 
k=1 


(20) 0 4 Xa Xk Xktl b x 
将 zi 视 为 节点 ,(20) 式 相当 于 用 分 段 线 性 插值 汪 数 作 图 3.8” 定 积分 的 近似 计算 
为 (z+) 的 近似 , 称 为 (复合 ) 梯 形 求 积 公式 . 

为 提高 精度 可 以 用 分 段 二 次 插值 函数 代替 f(zx). 由 于 每 段 要 用 到 相 邻 两 个 小 区 间 端 
点 的 3 个 函数 值 , 所 以 小 区 间 的 数目 必须 是 偶数 , 记 7 二 2m,k 二 0,1,…,m 一 1. 在 第 衣 段 
的 两 个 小 区 间 上 用 3 个 节点 (Zaky js) (Zazktfly fart1)s (ok+2 ， jia ) 作 二 次 插值 函数 
SCz)， 然 后 积分 可 得 
| Si)dr = $fat 4fom + fae). 


求 m 段 之 和 就 得 到 整个 区 间 上 的 近似 积 
5 和 (fo 王 沪 5 + 4 fom 227), h = (6— a)/2m, (21) 
它 称 为 (复合 ) 辛 普 森 求 积 公式 (抛物 线 公 式 ). 

我 们 看 到 ,不 论 广 是 一 个 复杂 函数 f(z) 在 某 些 离散 点 的 值 ,还 是 本 来 就 是 一 些 离散 
数据 (也 可 看 作 函 数 ) ,都 可 以 用 简单 的 线性 或 二 次 焉 数 代替 原来 的 函数 作 积 分 ,得 到 梯形 
公式 和 辛普森 公式 . 这 类 方法 称 为 Newton-Cotes 方法 . 

2， 误 差 估 计 和 收敛 性 

梯形 公式 在 小 区 间 [ze,zst,] 上 是 用 线性 插值 函数 T(x) 代替 /(x), 由 (8) 式 容易 


f(z) = Kar en & € (zkyZHH ). (22) 
Pi mE 
因为 (x 一 X41) (zx 一 Xxxri) 在 [xx ,Xr+1] 上 不 变 号 ,所 以 由 (22) 式 和 积分 中 值 定理 ,有 
人 0 ee a Ce 


3 
= 一 息 了 Cp) WE € (@ Se (23) 
梯形 求 积 公式 (20) 的 误差 可 用 - 
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n—l1 
en | MO 2 ee LE Dp) 
at (24) 
区 语 | 二 Ef ee 


给 出 。 | 
由 此 还 可 看 出 , 若 记 Mi 二 max| 六 (x)|,zE (a,6) (Ms 常 可 以 粗略 地 估 出 ) ,注意 到 上 
二 《6b 一 a)/n, 就 有 
h? 
| I TT [< TaM2 (0 — a). ， (25) 
《25) 式 表明 ,梯形 公式 (20) 的 误差 至 少 是 h? 阶 的 .于 是 若 ff€EC (ap) ,由 (24) 式 (25) 式 
可 得 时 lim- 一 一 <( 非 零 常数 )， 称 梯形 公式 (20) 是 2 阶 收敛 的 . 


类 似 地 ,可 以 求 出 辛普森 求 积 公式 (21) 的 误差 1T 一 S, |= || /czydz 一 s,| 为 


[I-85, Ee 3M (6 一 a)， (26) 


其 中 Mi 一 max| FoCz)|,zE (a,6). ee ee h' 阶 . 车 f€E C'(a,5b), 称 辛 
普 森 | 


公式 (21) 是 4 阶 收 和 敛 的 . 
3. 步 长 的 自动 选取 
我 们 看 到 近似 求 积 公式 的 误差 随 着 ”的 增加 ( 即 步 长 上 的 减 小 ?而 减 小 ,但 是 对 于 给 
定 的 jz) 和 设 定 的 误差 s, 在 选 定 了 求 积 公式 后 如 何 确定 x 呢 ? 实际 的 运算 过 程 是 用 二 
分 法 每 次 将 n 增加 一 倍 ,直到 误差 满足 要 求 为 止 . 以 梯形 公式 为 例 说 明 这 一 过 程 . 


由 (24) 式 知 , 当 zx 增加 一 售 即 缩小 一 半 时 ,I 一 Ts， ~ 了 (1 一 T,) ,由 此 不 难得 到 


工 一 To ~ (To — T,). (27) 


所 以 只 要 |Tz, 一 T,|<e, 计算 出 的 T2, 即 可 满足 |1 一 To | 过 e 的 误差 要 求 . 

这 种 选取 步 长 的 另 一 个 好 处 是 ,每 次 节点 加 密 一 倍 时 , 原 节 点 的 函数 值 六 不 需要 重 
新 计算 ,只 需求 出 新 节点 的 函数 值 即 可 (为 什么 ?). 

我 们 看 到 ,用 线性 插值 函数 近似 求 积 得 到 的 梯形 公式 ,与 用 二 次 插值 函数 近似 求 积 得 
到 的 辛普森 公式 相 比 ,后 者 收敛 性 的 阶 数 提高 了 . 是 否 要 用 更 高 阶 的 插值 多 项 式 来 近似 被 
积 函 数 ? 3.2 节 的 龙 格 现象 说 明 , 这 样 做 不 一 定好 . 下 面 从 另 一 个 角度 考虑 提高 计算 精度 
的 问题 . 


3.3 数值 积分 


3.3.2 高 斯 求 积 公式 n 代 加 克 
上 面 Newton-Cotes 方法 的 几 种 求 积 公式 (19) 一 (21) 可 以 写成 如 下 的 统一 形式 
I, 一 Daf) (28) 


其 共同 点 是 将 积分 区 间 等 分 将 分 点 作为 节点 ， 用 分 段 插值 多 项 式 代 蔡 f(x) 作 积分 ,因而 
节点 数 n 给 定 后 节点 ze(E 一 1,…,z) 是 固定 的 ,不 同 的 公式 只 在 于 系数 A 选择 的 差别 . 
可 以 设想 ,如 果 zt 和 A 都 可 以 选择 ,自由 度 更 大 ,计算 精度 可 能 更 高 . 高 斯 公式 就 是 由 此 
出 发 的 ,不 过 在 推导 之 前 先 要 明确 衡量 精度 的 指标 . 


1. 代数 精度 
用 霉 函数 作为 被 积 函 数 /, 以 近似 积分 与 精确 值 是 否 相等 作为 精度 的 度量 指标 ,有 如 
下 定义 | N27 
设 f(x)==x* ,用 (28) 式 计算 1 = | f(z)dz, 车 对 于 二 0， 1,…,m 都 有 了 =: 了 ,而 当 
有 一 及 十 1 时 天 天 也 则 称 卫 的 代数 精度 为 六 . 由 和合: 给 
0 Re 
4) ,二 者 相等 ， i T， 二 6 二 4(pr Toz) ,二 者 不 等 . 
TT 3 
2. 高 斯 公式 


先 看 x=2 的 情况 . 因为 只 有 2 个 节点 ,所 以 按照 固定 节点 的 办 法 只 能 用 梯形 公式 , 代 
数 精度 为 1. 而 用 下 面 的 方法 在 区 间 内 适当 地 选择 节点 ,将 会 得 到 代数 精度 为 3 的 公式 . 


区 间 (a,6) 经 过 适当 的 变量 代 换 可 以 化 为 《一 1，1), 因而 只 需 计算 I= | f(x)dz. 
要 构造 形 如 
| Gs = Alflzxi) dt Af lx,) (29) 
的 求 积 公式 ,确定 4 个 参数 X11»X2 ,Ai ,As 使 Cs 的 代数 精度 尽量 高 
可 以 由 4 个 条 件 确定 参数 . 按照 代数 精度 的 定义 ,我 们 要 求 对 于 jz) 一 1,zyz2，za， 
| fendz 二 


都 成 立 ,将 上 述 f(x) 代入 计算 可 得 
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Al 十 A, = 2， 
Aiz!l 十 Asx, = 0， 
Aiz? + Aszt = 2/3, 
Aizi 十 Aszxi = 二 0. 
解 出 zi 二 一 1/V3,zs 二 1/V3,Al 一 As 二 1, 代入 (29) 式 即 得 "一 2 的 高 斯 公式 
G, = /一 1/V3) + f(1/ VD). (31) 


30) 


Gs 的 代数 精度 为 3. 
当 节 点 数 n 增加 时 ,精度 可 以 提高 .n 个 节点 的 高 斯 公式 G。 = >)Arf (zr) 有 2n 个 
k= 


可 选择 的 参数 福 19 ”9 人 mn ,Ai ED ,A, ,其 代数 精度 可 达 271 一 1， 但 是 要 解 形 如 方程 组 (30) 
的 、 更 复杂 的 非 线 性 方程 组 ,所 以 实际 上 1 不 能 太 大 . 

实际 上 常用 的 办 法 是 将 积分 区 间 分 小 ,在 小 区 间 上 用 不 太 大 的 G，. 而 在 节点 加 密 
一 倍 时 能 够 利用 原 节 点 的 函数 值 ,需要 把 区 间 的 端点 作为 固定 节点 ,于 是 有 高 斯 公式 的 改 
进 形式 ,如 Gauss-Lobatto 求 积 公式 为 

G, 三 Alf(a) 十 Sy Ca | (32) 

其 中 a,b 为 小 区 间 的 端点 ,zs AI ,A 为 2n—2 个 参数 ;适当 地 确定 它们 可 使 
《32) 式 的 代数 精度 达到 2 一 3. 


3.3.3 自 适 应 求 积 方法 


不 论 是 前 面 的 Newton-Cotes 方法 ,还 是 Gauss-Lobatto 方法 ,在 将 积分 区 间 分 小 的 
过 程 中 都 是 采取 等 分 的 办 法 ,这 对 积分 区 间 上 变化 基本 
一 致 的 函数 是 合适 的 ,但 是 若 被 积 函数 变化 快慢 相差 较 
大 ,计算 效率 就 很 低 了 . 所 谓 自 适应 (adaptive) 求 积 的 直 
观 想法 是 将 函数 变化 较 快 的 区 间 分 得 细 一 些 , 函 数 变化 
较 慢 的 区 间 分 得 粗 一 些 ,其 示意 图 如 图 3. 9. 

实际 的 做 法 是 首先 如 在 步 长 的 自动 选取 中 介绍 的 . 
那样 ,对 于 给 定 的 求 积 公式 ,类 似 于 (27) 式 找 出 n 等 分 
区 间 和 zm 等 分 区 间 ( 设 x 二 m) 两 次 计算 结果 ( 记 作 Q, 和 和 Q,) 的 误差 |Q, 一 Q, | 与 11 一 QQ&,| 
的 关系 (I 是 积分 的 精确 值 ), 区 间 的 细 分 只 对 那些 |Q, 一 Qv | 不 满足 误差 要 求 的 子 区 间 
进行 . 


3.3.4 用 MATLAB 做 数值 积分 
”数值 积分 可 用 下 面 几 种 命令 实现 ; 


》 


图 3.9 自 适 应 求 积 的 示意 图 


3.3 数值 积分 
trapzCx) 用 梯形 公式 (C20) 计算 4 二 1), 输 入 数组 x 为 fi (k= 二 0,1,…,n) 
trapz(x,y) 用 梯形 公式 计算 ,输入 x,y 为 同 长 度 的 数组 ,输出 y 对 x 的 积 


分 ( 步 长 可 不 相等 ) 
quad('fun',a,b,tol) ”用 自 适 应 辛普森 公式 计算 ,输入 被 积 函 数 fun 可 以 自 定 义 ,如 
exp( 一 x."2)( 或 直接 用 库 函 数 如 sin) ,也 可 以 是 fun.m 命名 的 
函数 M 文件 (可 用 @fun) ,积分 区 间 (a,b), 绝 对 误差 tol( 缺 省 
时 为 10 司 ) ,输出 积分 值 : 
quadil'fun',a,b,tol) ”用 自 适应 Gauss-Lobatto 公式 计算 ,其 余 同 上 


/4 
例 2 用 几 种 公式 计算 |” 一 -一 dx, 与 精确 值 /2 比较 ,并 观察 计算 误差 与 步 长 的 
(1) 辛普森 公式 
z1= quad('1./(1— sin(x))',0,pi/4) % 运算 符号 必须 以 数组 形式 出 现 


结果 为 zt = 1.41421359288212 

(2) Gauss-Lobatto 公式 

z2=quadl('1./(1— sin(x))',0,pi/4) 

结果 为 z2 = 1.41421367595081 
精确 值 z =V2== 1. 41421356237310 

误差 : z1 一 z =3.05x 107,z2 一 z = 1.14x10- , 均 小 于 10-4. 
以 上 都 可 先 建立 以 s. m 命名 的 函数 M 文件 : 


function y= s(x) 
y= 1./(1— sin(x)); 


再 用 
zi 二 quad(@s,0,pi/4) 或 z2=quadl(@s,0,pi/4) 计算 . 
(3) 梯形 公式 
将 [0， x/4] 100 等 分 ,编程 如 下 : 


x=0:pi/400:pi/4; 

y=1./(1— sin(x)); 

z3= trapz(y) * pi/400 

结果 为 z3 =1.41425079175829 
误差 : z3 一 z = 3.72 X10-5. 


实验 3 插值 与 数值 积分 


可 以 看 到 , 当 已 知 被 积 函数 的 解析 表达 式 时 ,quad 和 quad 使 用 方便 , 步 长 自动 选取 


达到 预 设 误差 ,但 它们 不 能 像 trapz 那样 ,对 用 数值 给 出 的 x,y 数组 做 积分 . 


为 了 观察 计算 误差 与 步 长 的 关系 ,用 梯形 公式 和 辛普森 公式 做 如 下 计算 . 


(4) 数值 积分 误差 与 步 长 的 关系 


给 定 步 长 时 用 辛普森 公式 应 按照 (21) 式 计算 ,编程 如 下 : 


n= 10; 

h= pi/4/n; 

x=0 : h: pi/4; 

y=1./(1— sin(x)); 

23==trapz(y) * hi 

w3=z3 一 sqrt(2); 

k= |length(y); 

yi=[y(2 :2:k—1)];si=sum(y1); 
y2=[y(3 : 2 :k 一 1)];s2=sum(y2); 
24=(y(1)+y(k)+4x sl+2 * s2) * h/3; 


% 给 定 步 长 


% 用 梯形 公式 计算 
% 误差 


% 用 辛普森 公式 计算 


WwW4=z4”— sqgrt(2); 
[Ln,z3,w3,2z4,w4]' 


% 误差 


得 到 n= 二 10,20,40,80 时 梯形 公式 和 辛普森 公式 计算 的 结果 ,分 别 用 TT, 和 和 SS, 表示, 如 
表 3.4, 其 中 工 是 精确 值 .由 表 可 以 看 出 随 着 n 的 增加 误差 TT, 一 I 和 S, 一 工 的 变化 ,并 且 
T, 一 了 与 Twi 一 了 TT, 的 关系 验证 了 《25) 式 的 结果 . 


表 3.4 梯形 公式 和 辛普森 公式 的 误差 与 步 长 的 关系 


20 40 


80 


1. 4151438045 


1.4144462191 


1. 4142717326 


0. 0027846143 


0.0006975854 | 


0.0001744865 


n 10 
Ts; 1. 4179284188 
了 wa 一 了 
Tl 0.0037148564 
S, 1.4142453192 
So 一 3 


0. 0009302421 
1.4142155998 1.4142136906 


0.0000297194 0.0000019092 


人 
0. 0002326567 


0. 0000581702 


1. 4142135704 


0. 0000001202 


0. 0000317568 


3.3.5 卫星 轨道 长 度 ( 续 ) 


按照 3. 1. 2 节 模 型 (1) 式 计算 ,其 中 4 二 7782.5,6 二 7721,5, 编 程 如 下 ; 
建立 以 weixing. m 命名 的 函数 M 文件 : 


function y= weixing(t) 


0.0000020374 0. 0000001282 


0. 0000000080 


3.3 数值 积分 


a=7782.5; b=7721.5; 
y= sqrt(a’2 x sin(1).“2+ b°2 x cos(t).°2); 


t=0 : pi/10 : pi/2; 

y1= weixing(t) ; 

11=4 x tapz(t,y1) 

12=4x* quad('weixing' ,0 ,pi/2, 1e— 6) 


得 到 


11 三 4.870744099902405e 十 004 
Il2 三 4.870744099903280e 十 004 


可 以 看 出 ,梯形 公式 ( 仅 将 区 间 5 等 分 ) 给 出 了 很 好 的 结果 ,轨道 长 度 为 4. 87X10'km. 
3.3.6 广义 积分 的 数值 计算 


形 如 | f(z)dz 或 | f(x)dz(f 在 茶点 € [a, 杂 无 田 ) 的 积分 是 广义 积分 ,在 它们 收 
敛 的 前 提 下 讨论 其 数值 计算 方法 . 四 

1. 无 穷 区间 的 截断 

对 无 穷 区 间 的 积分 | /(z)dz, 可 以 将 了 的 “尾巴 " 截 去 ,化 为 有 限 区 间 的 积分 ,其 关键 
是 要 事先 估计 出 截断 部 分 的 数值 ,使 之 满足 精度 要 求 . 


例 3 计算 工 一 | edz, 使 误差 在 10* 以 内 
为 估计 截断 部 分 | er dz 的 值 ,利用 xz? 守 Nz(z 之 N) 时 
站 ”yk 1 nN: 1n-8 二 7 
| sr<|e dr = Ne 和 10”,， N=4., 
r4 


于 是 只 需 用 数值 方法 计算 | dz 就 可 以 了 . 用 辛普森 公式 做 如 下 计算 
z= quad('exp(—x.°2)',0,4,1e—7) 


即 得 z 二 0. 88622691889778, 而 精确 值 了 = [ee dx 一 处 ~0.88622692545276, 所 以 取 
0, 8862269 保证 误差 在 10”” 以 内 . 

2. 无 界 函 数 的 处 理 

对 于 | f(z)dz(f 在 菜 点 EE [a, 寻 无 界 ) 形式 的 积分 ,要 “ 控 ? 去 c 点 附近 一 邻 域内 的 


积分 ,其 关键 也 是 要 估计 出 这 一 部 分 的 积分 值 . 
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例 4 计算 I 二 | 上 中 dz, 使 误差 在 10 以 内 . 
被 积 函 数 在 z==0 处 无 界 , 去 掉 一 小 区 间 [0,+j, 但 是 需要 作 如 下 估计 : 
1, | dr < | lnz | dz = 7r(| lnr | 十 1). 


取 r = 1077,T, 1077(2.3X7 十 1) 过 10™. 下 面 用 数值 方法 计算 | - Leas. 


z= quad('— log(x)./(1+x)',1e—7,1) 


时 > 二 0. 82247094537944, 而 精确 值 是 了 二 | tar z 一 五 ~ 0. 82246703342411 ,所 以 
取 0. 8225 可 满足 误差 要 求 . 
3.3.7 二 维 数值 积 


计算 定 积分 的 梯形 公式 和 辛 普 公式 原则 上 都 可 以 推广 到 重 积 分 ,MATLAB 有 算 
形 域 上 利用 quad 计算 二 重 积分 的 命 


dblquad( fun’', xmin, xmax, ymin, ymax) 


其 中 fun 是 被 积 函 数 ,用 法 与 quad 相同 (函数 M 文件 可 用 @fun) ,其 余 依次 是 积分 区 间 x 
的 下 、 上 限 和 y 的 下 、 上 限 . 


gre 
例 S 计算 I = | | f(z,y)dzdy, 其 中 zy) = ln(r+2y) a = 1.4,6= 2.0,c= 


1.0,d 一 1.5. 
直接 用 


z= dblquad(og(x+2*y)',1.4,2,1,1.5) 


xz 一 0. 42955452753196, 而 积分 的 精确 值 为 T==0.42955452754828. 
类 似 地 有 三 重 数值 积分 的 运算 命令 


triplequadC fun', xmin, xmax, ymin, ymax ,zmin, zmax) 
ET 
3.4 实验 练习 
实验 目的 


1. 掌握 用 MATLAB 计算 拉 格 朗 日 、 分 段 线 性 、 三 次 样 条 三 种 插值 的 方法 ,改变 节点 
的 数目 :对 三 种 插值 结果 进行 初步 分 析 . 


3.4 实验 练习 


2. 掌握 用 MATLAB 及 梯形 公式 .辛普森 公式 计算 数值 积分 . 

3. 通过 实例 学 习 用 插值 和 数值 积分 解决 实际 问题 . 

预备 ; 编制 计算 拉 格 朗 日 插值 的 m 文件 . 对 于 数值 给 出 的 函数 ,编制 用 辛普森 公式 
计算 定 积分 的 程序 ,命名 为 simp. m 文件 . 

1. 选择 一 些 函 数 , 在 7 个 节点 上 (xn 不 要 太 大 ,如 5~11) 用 拉 格 朗 日 .分 段 线性 、 三 次 
样 条 三 种 插值 方法 ,计算 m 个 插值 点 的 函数 值 (m 要 适中 ,如 50 ~ 100). 通过 数值 和 图 形 
输出 ,将 三 种 插值 结果 与 精确 值 进行 比较 .适当 增加 ”再 作 比 较 , 由 此 作 初 步 分 析 . 下列 
函数 供 选择 参考 : 

(1) y = snz，0 巡 z 委 2r ; 

(2) y= (1 一 z)22， 一 1 过 工 二 1 

(3) y = coslz， 一 2 委 工 委 2; 

(4) y = exp( 一 和 好)， 一 2 委 工 生 2. 

2. 用 > 一 x 中 在 x 一 0, 1, 4, 9,16 产生 5 个 节点 P; ,…，,Psi. 用 不 同 的 节点 构造 插 
值 公式 来 计算 z=5 处 的 插值 (如 用 Pl…Ps; Pi…P,; P…Pii…), 与 精确 值 比较 并 进 
行 分 析 . 

3. 用 梯形 公式 和 辛普森 公式 计算 由 表 3. 5 数据 给 出 的 积分 | ，y(z)dz: 


5 1.3 


0. 9 


1.1611 


1. 3971 


已 知 该 表 数 据 为 函数 > 一 z 十 sinz/3 所 产生 ,将 计算 值 与 精确 值 作 比较 . 

4. 选择 一 些 函 数 用 梯形 .辛普森 和 Gauss-Lobatto 三 种 方法 计算 积分 . 改变 步 长 (对 
”梯形 ) ,改变 精度 要 求 ( 对 辛普森 和 Gauss-Lobatto) ,进行 比较 .分 析 . 如 下 函数 供 选 择 
参考: 


四 


ZX 十 1 
(2) y=e™sin2x, 0&ZrR2:; 
(3) y= V1l+zx, O07re2; 


1 
2 


e 
V2N 
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5. 选用 三 种 数值 积分 方法 计算 元. 
6. 弹簧 在 周期 性 外 力作 用 下 (忽略 阻力 ) 其 位 移 xz (zt) 满足 微分 方程 mz 十 kz 二 
Fcoswt， 在 初始 条 件 z(0) 二 x(0) 二 0 下 的 解 为 


z(t) = ein (e 7 )sin (~ 7) ， wo 一 /Ez w. 
已 知 2 一 1, 二 9, 下 二 1,w 二 2, 求 0 入 :长 2 内 zx(1) 的 平均 
值 , 作 x(t) 和 这 个 平均 值 的 图 形 . 
”7. 如 图 3.10 电路 ,电容 C 充电 至 电压 V 后 开关 上 倒 向 电 
阻 尺 , 求 放电 电流 在 电阻 上 作 的 功 . 设 V=25CV),R=10(kQ),C 
二 100(CppF). 适 当 处 理 时 间 上 ~ce 的 问题 ,并 与 精确 值 比较 . 


ge ; 
g. 求 | Sdz 的 数值 积分 ,使 误差 在 10- 以 内 . 图 3.10 第 8 题 电 路 


9. 求 | ”smzdz 的 数值 积分 ,使 误差 在 10-* 以 内 . 

10. 表 3.6 给 出 的 z,y 数据 位 于 机 要 断面 的 轮廓 线 上 ,Y1 和 Y2 分 别 对 应 轮 麻 的 上 
下 线 . 假设 需要 得 到 x 坐标 每 改变 0.1 时 的 y 坐标 . 试 完成 加 工 所 需 数据 , 画 出 射线 , 求 加 
工 断 面 的 面积 

表 3.6 机 杜 断 面 轮廓 线 上 的 数据 


11. 图 3. 11 是 欧洲 一 个 国家 的 地 图 ,为 了 算出 它 的 国土 面积 ,首先 对 地 图 作 如 下 测 
量 ; 以 由 西向 东方 向 为 工 轴 ,由 南 到 北方 向 为 y 


” 轴 , 选 择 方便 的 原点 ,并 将 从 最 西边 界 点 到 最 东 
边界 点 在 工 轴 上 的 区 间 适 当地 划分 为 若干 段 ， 
在 每 个 分 点 的 > 方向 测 出 南边 界 点 和 北边 界 点 
的 y 坐标 y 和 y; ,这 样 就 得 到 了 表 3. 7 的 数据 

(单位 : mm). 

根据 地 图 的 比例 我 们 知道 18mm 相当 于 
40km, 试 由 测量 数据 计算 该 国 国 土 的 近似 面积 ， 
与 它 的 精确 值 41288 km 比较 . 


0 一 一 40km 
图 3.11 地 图 


表 3.7 地 图 边界 点 数据 


x |7.0 |10.5|13.0|17.5 | 34.0 | 40.5 | 44.5 | 48.0 | 56.0 | 61.0 | 68.5 | 76.5 | 80.5 | 91.0 


12, 在 桥梁 的 一 端 每 隔 一 段 时 间 记 录 lmin 有 几 辆 车 过 桥 ,得 到 表 3. 8 数据: 
表 3.8 过 桥 车 辆 数据 


试 估计 一 天 通过 桥梁 的 车 流量 . 
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常 微分 方程 数值 解 


人 们 在 研究 物体 的 运动 .热量 或 声波 的 传播 .电路 中 电压 与 电流 的 变化 等 物理 现象 ， 
以 及 人 口 增长 的 预测 , 血 药 浓 度 的 变化 ,交通 流量 的 控制 等 过 程 中 ,作为 研究 对 象 的 函数 ， 
要 和 函数 的 导数 一 起 ,用 一 个 符合 其 内 在 规律 的 方程 来 描述 ,这 就 是 微分 方程 . 微分 方程 
是 用 数学 方法 分 析 客 观 对 象 变化 规律 的 有 力 工具 ,是 一 类 重要 的 数学 模型 . 

建立 微分 方程 只 是 解决 问题 的 第 一 步 , 通 常 需要 求 出 方程 的 解 来 分 析 实 际 现象 ,并 加 
以 检验 . 虽然 有 时 可 以 利用 微 积 分 方法 求 出 某 些微 分 方程 的 解析 解 ,但 是 实际 上 大 量 的 微 
分 方程 都 不 能 获得 它们 的 解析 表达 式 ; 即使 有 时 能 获得 解析 解 , 其 表达 式 也 非常 复杂 , 难 
以 讨论 其 性 质 . 因此 必须 通过 数值 求解 的 方法 算出 微分 方程 在 某 些 离散 点 处 的 近似 解 , 进 
而 分 析 微分 方程 所 反映 的 客观 规律 . 

以 下 4.1 节 提出 几 个 简化 的 实际 问题 ,并 建立 其 微分 方程 模型 ;4. 2 节 讨 论 两 个 最 常 
用 的 数值 算法 : 欧 拉 (Euler) 方 法 和 龙 格 - 库 塔 (Runge-Kutta) 方 法 ;4. 3 节 介 绍 如 何 用 
MATLAB 实现 算法 ,并 给 出 4. 1 节 模 型 的 求解 过 程 ;4. 4 节 简单 介绍 单 步 法 的 收敛 性 、 稳 
定性 和 刚性 方程 ;4. 5 节 是 实验 练习 . 


4.1 实例 及 其 数学 模型 


4.1.1 海上 缉私 


问题 ”海防 某 部 缉私 艇 上 的 雷达 发 现 正 东方 向 < 海里 处 有 一 稻 走 私 船 正 以 一 定 速 
度 向 正 北方 向 行驶 ,缉私 艇 立即 以 最 大 速度 前 往 拦 截 . 用 雷达 进行 跟踪 时 ,可 保持 缉私 艇 
的 速度 方向 始终 指向 走私 船 . 建立 任意 时 刻 缉私 艇 的 位 置 和 缉私 艇 航线 的 数学 模型 ,确定 
缉私 艇 追 上 走私 船 的 位 置 , 求 出 追 上 的 时 间 . 

模型 ”建立 直角 坐标 系 如 图 4.1, 设 在 1 二 0 时 刻 缉 私 艇 发 现 走 私 船 , 此 时 缉私 艇 的 
位 置 在 O(0, 0), 走 私 船 的 位 置 在 (ce, 0). 走私 船 以 速度 a 平行 于 y 轴 正 向 行驶 ,缉私 艇 以 
速度 2 按 指向 走私 船 的 方向 行驶 (5 之 a). 在 任意 时 刻 i 缉私 艇 位 于 P(x, y) 点 ,而 走私 船 
到 达 Q(c,al) 点 ,直线 PQ 与 缉私 艇 航线 (图 4.1 中 曲线 ) 相 切 , 切 线 与 x 轴 正 向 夹 角 


4.1 实例 及 其 数学 模型 
为 a. 


缉私 艇 在 z，y 方向 的 速度 分 别 为 昱 一 bcosa, 昱 =bsina, 由 直角 三 角形 PQR 写 出 
sina 和 cosa 的 表达 式 ,得 到 微分 方程 


dz blc— xz) - 
dt VT Ta — yr 
dy blat 一 y) 
dt Mle—zr) F(a — yy 
初始 条 件 为 | 避 
(0 =.0% HO 0, (2) 


图 4.1 海上 缉私 


这 就 是 缉私 艇 位 置 (x(z)， y(t)) 的 数学 模型 .但 是 由 方 
程 (1) 无 法 得 到 x(t)，y(t) 的 解析 解 , 需 要 用 数值 算法 求解 . 我们 将 在 4. 3 节 继 续 讨 论 这 
个 问题 . 

需要 说 明 的 是 ,缉私 艇 并 不 知道 走私 船 的 速度 多 大 ,和 否则 缉私 艇 可 以 容易 地 沿 一 条 直 
线 追 上 走私 船 ,不 必用 雷达 跟踪 . 若 走私 船 的 速度 已 知 ,请 读者 给 出 缉私 艇 航线 的 方向 和 
追 上 的 时 间 . 


4.1.2 弱肉强食 


问题 ”自然界 中 在 同一 环境 下 的 两 个 种 群 之 间 存 在 着 几 种 不 同 的 生存 方式 ,比如 相 
互 竞争 , 即 争夺 同样 的 食物 资源 ,造成 一 个 种 群 趋 于 灭绝 ,而 另 一 个 趋向 环境 资源 容许 的 
最 大 容量 ;或 者 相互 依存 , 即 彼此 提供 部 分 食物 资源 ,二 者 和 平 共 处 , 趋 于 一 种 平衡 状态 ; 
再 有 一 种 关系 可 称 之 为 弱肉强食 , 即 某 个 种 群 甲 靠 丰富 的 自然 资源 生存 ,而 另 一 种 群 乙 靠 
捕食 种 群 甲 为 生 ,种 群 甲 称 为 食 饵 (prey) ,种 群 乙 为 捕食 者 (predator) ,二 者 组 成 食 饵 一 捕 
食 者 系统 . 海洋 中 的 食用 鱼 和 软骨 色 ( 涂 鱼 等 ) .美洲 免 和 山猫 .落叶 松 和 蚜虫 等 都 是 这 种 
生存 方式 的 典型 . 这 样 两 个 种 群 的 数量 是 如 何 演变 的 呢 ? 近 百 年 来 许多 数学 家 和 生态 学 
家 对 这 一 系统 进行 了 深入 的 研究 ,建立 了 一 系列 数学 模型 ,本 节 介绍 的 是 最 初 的 .最 简单 
的 一 个 模型 , 它 是 意大利 数学 家 Volterra 在 20 世纪 20 年 代 建 立 的 . 

模型 ”用 zx(z) 表 示 时 刻 1 食 人 饵 ( 如 食用 鱼 ) 的 密度 , 即 一 定 区 域内 的 数量 ,y(t) 表 示 捕 
食 者 (如 小 鱼 ) 的 密度 . 假设 食 饵 独立 生存 时 的 (相对 ) 增 长 率 为 常数 x>>0, 即 z/z 二 7+, 而 捕 
食 者 的 存在 使 食 饵 的 增长 率 减 小 , 设 减 小 量 与 捕食 者 密度 成 正比 ,比例 系数 为 之 0, 则 
ZX/r=r—ay. | 

捕食 者 离开 食 饵 无 法 生存 , 设 它 独自 存在 时 死亡 率 为 常数 4 之 0, 即 y/y== 一 4d, 而 食 
饵 的 存在 为 捕食 者 提供 了 食物 ,使 捕食 者 的 死亡 率 减 小 . 设 减 小 量 与 食 饵 密度 成 正比 , 比 
例 系 数 为 6 之 0, 则 y/y== 一 (d 一 bz). 实际 上 , 当 bx>>a 时 捕食 者 密度 将 增长 . 
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so 


实验 4 常 微分 方程 数值 解 


给 定 食 饵 和 捕食 者 密度 的 初始 值 x。，yo ,由 上 可 知 z(t)，y(#) 满 足以 下 方程 : 
: = (r—ay)r=rr—ary,; 


y =~— (d—br)y =— dy+tbry, (3) 
7X(0) = zxo,y(0) = yo. 
方程 组 (3) 的 解 xz(z)，y(z) 描 述 了 食 饵 和 捕食 者 密度 随时 间 的 演变 过 程 . 我 们 同样 得 不 到 
X(t)，y(t) 的 解析 解 , 需 要 用 数值 算法 求解 . 将 在 4. 3 节 继 续 讨 论 这 个 问题 . 


4.2 欧 拉 方法 和 龙 格 - 库 塔 方法 


我 们 从 一 阶 微分 方程 的 数值 算法 开始 . 设 有 
y x) = flzr,y), 
J = yo， 
其 中 已 知 孙 数 f(x,y) 对 y 满足 李 普 希 茨 (Lipschitz) 条 件 , 即 存在 常数 工 使 
| Jrz) 一 zyyz) | 委 工 | JIL 2 I 
以 保证 方程 (4) 的 解 > 一 y(z) 存 在 且 惟 一 . 在 满足 李 普 希 区 条 件 下 求解 方程 (4) 称 为 一 阶 
常 微分 方程 的 初 值 问 题 . 
所 谓 求 方程 (4) 的 数值 解 ,就 是 计算 (精确 ) 解 y(z) 在 一 系列 离散 点 zo 过 x 过 zs 二 … 过 
Zz, 三 … 的 近似 值 . 通常 选取 相等 的 计算 步 长 ,于 是 z, 一 zo 十 zz 一 1;2，…). 


4.2.1 欧 拉 方 法 
欧 拉 方 法 的 基本 思想 是 在 小 区 间 [z,,z,+i] 上 用 差 商 共 Ze 一 交 代替 方 程 (4) 左 


端的 导数 y ,而 方程 右 端 函数 F(z,y(Cz)) 中 的 工 取 [zz 的 某 一 点 ,于 是 
3yCzr) 王 yz) 十 ApGzy(z))，>xE [rozr]， (5) 


(4) 


文 取 [zx, ,xw+1j] 内 不 同 的 点 ,就 得 到 以 下 不 同 的 公式 . 


若 f(x,y(7x)) 中 的 z 取 区 间 [z, ,zxsti] 的 左 端点 Zi， 即 f(x,y(7x,)). 将 y(x,) 的 近 
似 值 记 作 y%， 即 y 守 yx) ;yiti 守 y(xst1), 则 得 到 近似 计算 公式 
yorH = yhflriyy), n= 0,1,2," (6) 
称 为 向 前 欧 拉 公式 ,意思 是 从 zo ,yo 算出 ;从 zz ,yi 算出 yi ,依次 向 前 一 步 步 计 算 . 
若 f(x,y(x)) 中 的 z 取 区 间 [Lz, ,xstij 的 右 端点 xa+1; 类 似 地 可 得 
Vrh = Ys hf rs yi), n= 0,1,2, (7) 
称 为 向 后 欧 拉 公 式 ,形式 上 是 从 xz,;; ,yw 向 后 算出 y,. 但 是 初 值 问 题 需要 从 ww 和 xt1 计 
算 y,+i, 当 消 数 f(x,y) 对 y 非 线性 时 ,(7) 式 无 法 直接 进行 计算 ,通常 要 用 迭代 法 求解 . 比 
如 先 由 向 前 欧 拉 公 式 算出 y,+1 的 初 值 


4.2 欧 拉 方 法 和 龙 格 - 库 塔 方法 


3 = yr hf zs yn), (7.1) 
再 按 如 下 和 迭代 公式 计算 
3 = yt hf ry yd ), k=0,1,2,. (7. 2) 
若 和 迭代 过 程 收敛 , 则 所 要 求 的 值 w+ 一 limy5:. 每 一 步 (2 一 0,1,2，) 都 要 进行 迭代 . 
向 前 欧 拉 公式 (6) 称 为 显 式 公式 ,向 后 欧 拉 公式 (7) 称 为 隐 式 公式 . 用 后 者 计算 比 前 者 
要 复杂 得 多 , (7) 式 实用 价值 不 大 . 
将 (6) 式 ,(7) 式 平均 得 到 


Ynt! = y+ FL) + fm ym)]) n=0,1,2," (8) 


” 称 为 梯形 公式 , 这 里 f(x,y(x)) 取 了 区 间 [z, ,zit j 左 右 端点 的 函数 的 平均 值 . 
显然 (8) 式 也 是 隐 式 公式 , 迄 代 过 程 计 算 量 大 ,通常 采用 预测 一 校正 方法 加 以 改进 : 
先 用 (6) 式 预测 y,+1 ,再 把 预测 值 代 入 (8) 式 右 端 作 一 次 校正 , 妈 
yr = ys hf x ys) 


yn = [fry) + fem)], n= 0,1,2," (9) 
称 为 改进 欧 拉 公 式 ， 
4.2.2 误差 和 阶 
当 我 们 用 上 面 的 欧 拉 公 式 计 算 精 确 解 y(z,) 的 近似 值 y, 时 ,一 般 每 计算 一 步 都 会 有 
误差 ,并 且 误 差 还 会 一 步 一 步 地 积累 . 这 里 只 讨论 计算 一 步 出 现 的 误差 : 假定 y, 没有 误 


差 , 即 办 一 y(z) 估计 yt 的 误差 y《znt1) 一 yn+t1; 称 为 局 部 截断 误差 , 
为 估计 欧 拉 公 式 的 局 部 截断 误差 , 先 将 精确 解 yx,+1) 在 z, 处 作 泰勒 展开 


OE Rr A yz,) 十 OO )， (10) 
对 于 向 前 欧 拉 公 式 (6) ,在 六 一 y(z) 的 假定 下 可 记 作 
Yap 一 y(Cz) 十 ArGzy(Cz)) = yr) hy’ (zr,). (11) 
由 (10) 式 与 (11) 式 之 差 得 到 
2 
te Sy Cr) 4 OC) = Oh ), (12) 


式 中 的 最 低 阶 项 与 (x,) 称 为 局 部 截断 误差 主 项 , 它 对 于 是 2 阶 的 ， 


对 于 向 后 欧 拉 公式 (7) , 先 规定 右 端 y(z,) 二 yi)y(Xnt1) 二 ynt1; 然 后 讨论 左 并 w+) 与 
y(t1) 之 差 , 注意 到 (7) 式 右 端 (zwtiyyot1) 一 yy (zwt1) ,并 对 y (zxo+1) 作 泰勒 展开 ,得 
yat = yz) 十 joy xan) = yx) th[ly zi) hy’ zi) + OR )]. (13) 
由 (10) 式 与 (13) 式 之 差 得 到 


eR 


i 
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2 
Tei 三 3CZntl) 一 yn+Hl 一 一 yz) 十 OC(h’) = Oh’). (14) 


其 局 部 截断 误差 主 项 刚好 与 向 前 欧 拉 公式 相差 一 个 负 号 ,对 于 h 也 是 2 阶 的 . 
由 于 梯形 公式 是 向 前 和 向 后 欧 拉 公式 的 算术 平均 ,因此 其 局 部 截断 误差 也 是 (12) 式 
和 (14) 式 的 算术 平均 ,h 的 2 阶 项 正好 抵消 ,将 上 面 的 泰勒 展开 至 及 项 即 可 得 到 


总 
工 ， =— $Y Cz,) + Oh') = OC ). (15) 


局 部 截断 误差 对 疡 是 3 阶 的 . 

数值 计算 方法 (公式 ) 的 精度 是 由 局 部 截断 误差 中 4 的 阶 定义 的 : 如 果 一 个 方法 ( 公 
式 ) 的 局 部 截断 误差 为 OCh?*!), 则 称 该 方法 (公式 ) 具 有 p 阶 精度 . 于 是 向 前 、 向 后 欧 拉 公 
式 的 精度 为 1 阶 , 而 梯形 公式 的 精度 为 2 阶 ,类 似 地 分 析 可 知 改进 欧 拉 公 式 也 为 2 阶 精 
度 . 精度 的 阶 比 局 部 截断 误差 的 阶 低 1. 


4.2.3 龙 格 - 库 塔 方法 
一 般 地 ,数值 方法 具有 越 高 阶 的 精度 ,得 到 的 解 就 越 精确 . 向 前 和 向 后 欧 拉 公式 各 用 
了 区 间 [zsz4t1] 一 个 端点 的 导数 ,它们 都 是 1 阶 精度 ,而 梯形 公式 和 改进 欧 拉 公式 用 了 


[Lz; ,Ts+14 上 的 两 个 导数 取 平 均 ,得 到 了 2 阶 精度 . 这 就 启 发 人 们 用 [zxz， ,zi 上 的 若干 个 
点 的 导数 ,对 它们 作 线 性 组 合 得 到 平均 斜率 ,就 可 能 得 到 更 高 阶 的 精度 ,这 就 是 龙 格 - 库 


为 了 演算 简单 起 见 ,我 们 仍 取 区 间 [x, ,z+1J 上 的 两 个 导数 ,介绍 推导 2 阶 龙 格 - 库 塔 
公式 的 过 程 ,目的 在 于 让 读者 了 解 龙 格 - 库 塔 方法 的 思路 . 

按照 下 式 在 x, 和 x, 十 ah《0 过 a 声 1) 两 个 点 上 取 导 数 作 线性 组 合 , 代 替 (6) 式 中 的 
rs 


Rk; = (x7) (16) 
ky.= frst ,yt oAhR), 0O<Za<l. 
其 中 入 ,4 ,a 为 待定 参数 ,确定 它们 的 准则 是 使 (16) 式 具有 尽量 高 阶 的 精度 . 注意 到 y, = 
yz,) 的 假定 ,并 对 &s 作 二 元 泰勒 展开 , 且 利 用 锯 二 y 二 f,y 二 f :十 f， f,,(16) 式 可 写作 
yo = yz) 十 + hkz), 
kh = fr yz,)) = y (x), oe 
kz = fCzs toh ,yz,) + ohki) Ca 
= yr) + hf Cressy C21)) + oki fy Cx yx)) 十 DC) 
= y (zr) oh(f, + 从 fy) + Oh’) = yz) + ohy zr,) + Oh?). 


下 = ,十 hCAiki 十 AsRs )， 


于 是 


4.2 欧 拉 方 法 和 龙 格 - 库 塔 方法 
yall 二 yz) 十 (十 jpy Cr) tT Aah’y (x,) + Ol’). (17) 
与 (10) 式 给 出 的 y(z,ri) 相 减 得 到 局 部 截断 误差 
Ti = Yr) yo = 1 hy Cx) + (Bh) hy Cz,) + OY. 
(18) 
易 看 出 , 只 需 选 取 Ai ) 人 2 3 满足 
人 十 Er » hza 一 也 ， (19) 


就 可 使 (16) 式 具有 2 阶 的 精度 . 

(19) 式 有 无 穷 多 组 解 , 所 以 得 到 的 是 一 族 2 阶 龙 格 - 库 塔 公式 . 请 读者 验证 : 当 取 
人 一 人? 二 1/2,a 一 1 时 就 得 到 改进 欧 拉 公式 (9). 

龙 格 - 库 塔 方法 具有 如 下 的 一 般 形式 : 


只 


i 
yl 一 yn + ho Rk; 
i=1 


kl 一 f(z; yy ) 


" (20) 
kz = f(x, cah, yt cahki) 


| 
ki = fz, eh, yt ch ask;), i= 3,4,.……,L 
j=1 


了 


点 Wl 
其 中 Ai Ci 和 2; 为 待定 参数 ,在 满足 这 = 1,0 委 ci 过 1， > ai 二 1 的 条 件 下 使 (20) 式 


的 局 部 截断 误差 个 首 项 中 广 的 老 次 尽量 高 . 若 T sa = OChrn ) , 刚 称 (20) 式 为 工 级 请 阶 
龙 格 - 库 塔 公式 . 

常用 的 4 级 4 阶 龙 格 - 库 塔 公式 ( 即 经 典 的 龙 格 - 库 塔 方法 ) 如 下 
oo 一 罗 十 二 (外 十 2j 十 2ks 十 h)， 


下 = f(x, ,yn), 


hh 二 f(z 十 务 ,y, 十 入!)， (21) 
二 f(z 十 分 :yr 十 坟 :)， 


ks = (zi 十 hy; 十 hk,)， 
它 具 有 4 阶 精 度 . 


4.2.4 常 微分 方程 组 和 高 阶 方程 初 值 问题 的 数值 方法 
欧 拉 方法 和 龙 格 - 库 塔 方法 都 可 直接 推广 到 求解 常 微分 方程 组 的 初 值 问题 ,如 对 于 
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= jzyyyz)， 
= ECZy yz)， (22) 


yx0) = yoyz(zo) = zxo， 
2 = yy, hf Cx, yn Ln), re a 
Ztl = ZT hg xi Yn Zr), 
龙 格 - 库 塔 公 式 有 类 似 的 形式 . 
对 于 高 阶 方程 ,需要 先 降 阶 化 为 一 阶 常 微 分 方程 组 ,然后 再 按照 上 面 的 方法 求解 . 降 
阶 的 办 法 并 不 惟一 ,对 于 高 阶 线性 方程 


3 十 al(z)yocD 十 … 十 az)Y 十 az)y = flr), (24) 
一 种 简单 .常用 的 方法 是 令 yi 二 y, 将 (24) 式 化 为 
yi 一 ya， 
一 ya， (25) 


3 一 一 Co(Z)yI 一 (ZX) 3 二 f(z). 


“ 4.3 龙 格 - 库 塔 方法 的 MATLAB 实现 


对 于 微分 方程 (组 ) 的 初 值 问题 
1。 = fx) X= Tip) f= fi, fi), 
x(to) = Ky We (Xxol ,To ) 


龙 格 - 库 塔 方法 可 用 如 下 MATLAB 命令 实现 其 计算 : 


(26) 


[i,x]= ode23( @f,is, x0,options) 

[t,xi= ode45( @f, ts,x0, options) 
其 中 ode23 用 的 是 3 级 2 阶 龙 格 - 库 塔 公 式 ,ode45 用 的 是 以 Runge-Kutta-Fehberg 命名 
的 5 级 4 阶 公式 . 

命令 的 输入 f 是 待 解 方程 写成 的 函数 M 文件 : 

function dx 三 ft,x) 

dx=[f1;f2;... ;fnj]; 

若 输 入 ts=[t0,tt,t2，.. ,tf, 则 输出 在 指定 时 刻 t0,t1,t2，... ,tf 的 通 数值 ; 若 输 
人 ts=t0:k: tf, 则 输出 在 Lt0, 内 以 k 为 间隔 的 等 分 点 处 的 函数 值 . x0 为 函数 初 值 
(n 维 向 量 ). options 可 用 于 设 定 误差 限 (options 默认 时 设 定 相 对 误差 10-3 ,绝对 误差 
10”) ,命令 为 : 


4.3 龙 格 - 库 塔 方法 的 MATIAB 实现 


options= odeset('reltol' ,rty'abstol', at) 


其 中 rt,at 分别 为 设 定 的 相对 误差 和 绝对 误差 . 

命令 的 输出 t 为 由 输入 指定 的 ts,x 为 相应 的 函数 值 (n 维 向 量 ). 

注意 : 计算 步 长 bh 是 根据 设 定 误差 限 自动 调整 的 ,并 不 是 输入 中 指定 的 输出 “ 步 
长 "k. 

下 面 继续 讨论 4.1 节 提 出 的 两 个 问题 . 


4.3.1 海上 缉私 ( 续 ) 


对 于 4.1.1 节 的 模型 (1), 先 设 定 参 数 ,用 龙 格 - 库 塔 方法 和 MATLAB 软件 求 其 数值 
解 , 再 设法 研究 其 解析 解 . 

模型 的 数值 解 

1. 设 走私 船 速度 ac= 20n mile/h?, 缉 私 艇 速度 5 二 40n mile/h, 初 始 距离 c= 
I5n mile, 由 模型 (1).(2) 求 任意 时 刻 缉私 艇 的 位 置 及 缉私 艇 航线 . 

对 于 给 出 的 a, b,c 用 MATLAB 求 数值 解 时 , 记 z(1) 一 rz，z(2) 一 2，z 一 (并 (1T)， 
(2)) .编写 如 下 M 文件 : 

function dx= jisi(t, x) % 建立 名 为 jisi 的 函数 M 文 件 

a=20; b=40; c= 15; 

s=sqrt((c—x(1D)°2+ (axt—x(2))"2); 

dx 二 [bx (c 一 XC(1))/s;bx (axt 一 x(2))/s]; % 以 向 量 形式 表示 方程 (1) 


在 编写 运行 程序 时 需 设 定时 间 上 的 起 终点 及 中 间 的 等 分 点 ,终点 可 参考 缉私 艇 知道 
走私 船 速度 时 沿 直 线 追 上 的 时 间 ( 约 为 0.4h) ,并 作 试 探 . 编程 如 下 : 


ts=0:0.05:0.5; . % 终点 试探 .调整 为 0.5, 输 出 “ 步 长 ”0.05 
x0=[0,0]; % 输入 xy 的 初始 值 (2) 
[txj=ode45(@jisi,ts,x0) ; % 调用 ode45 计算 

Lt,xj % 输出 t,x(t), y(t) 

plotCt,x), grid, % 按照 数值 输出 作 x(t), y(t) 的 图 形 
gtext('x(t)'), gtext('y(t)'), pause . 

plot(x( : ,1),x(C : ,2)), grid, % 作 y(x) 的 图 形 


gtextCx'), gtextl'y') 


得 到 的 数值 结果 x (1)，y (2 为 缉私 艇 的 位 置 , 列 人 表 4. 1. 走私 船 的 位 置 记 作 zi (2)， 
yi (Ci) ,显然 Xl (1) 一 c==15, yi (1) = 二 at 二 20i, 将 1 (直列 入 表 4.1 最 后 一 列 . 可 知 当 ZL 一 


@O nmili: 海 里 ,ln mile 一 1852m， 
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实验 4 常 微分 方程 数值 解 


0. 5h,Xx, yy 与 Xx1， 1 几乎 一 致 ,缉私 艇 追 上 走私 船 . X(t),， y(t) 及 y(z) 的 图 形 见 图 4. 2(a) 
和 图 4. 2(b) ,y(z) 为 缉私 艇 的 航线 ， 


表 4.1 a 二 20, b= 二 40,c 二 15 时 (1),(2) 的 数值 解 x(1)}, y(t) 和 y1 (2) 


i X(t) y(t) y1(t) 

0 ; 0 0 0 
0. 05 1. 9984 | 0. 0698 1.0 
0.10 3. 9854 0. 2924 2 六 
0.15 5.9445 0. 6906 3.0 
0. 20 7. 8515 1. 2899 4.0 

. 0. 25 9, 6705 2.1178 5.0 

0. 30 11. 3496 3. 2005 6.0 
0. 35 12. 8170 4. 5552 7.0 
0. 40 13. 9806 6. 1773 8.0 
0. 45 14.7451 8.0273 9.0 
0. 50 15. 0046 9. 9979 10.0 

20 -一 


0 Ql 02 03 04 05 
(a) x(1), Hi) (b) yo 


图 4.2 模型 (1),{2) 的 解 (a 二 20,5 二 40,c 二 15] 


2. 设 b,c 不 变 , 而 走私 船 速度 a 变 大 为 30，35,… ,接近 40n mile/h, 观 察 解 的 变化 . 

修改 a 的 输入 ,并 相应 地 延长 1 的 终点 . 设 4 二 35, 经 试探 1 的 终点 调整 为 1.6 合适 . 
表 4.2 是 计算 结果 ,其 中 z(t), y(t) 有 两 列 数字 ,左边 的 是 用 “默认 ”精度 ( 即 相 对 误差 
10 习 ,绝对 误差 10“') 计 算 的 ,中 间 的 y(t) =at 一 35: 是 走私 船 到 达 的 位 置 . 可 知 上 一 1.3 
时 缉私 艇 的 位 置 x 已 接近 15, 但 y 与 y1(t) 相 差 甚 远 ;t 一 1.4, 1.5 时 xz 超过 15, 这 是 不 
对 的 ;i 二 1.6 时 xX, y 与 x1, yi 也 有 差距 ,这 些 缺 陷 是 累积 误差 造成 的 . 可 试探 利用 ode45 


4.3 龙 格 - 库 塔 方法 的 MATLAB 实现 


的 控制 参数 options 提高 精度 (上 面 的 “调用 ode45 计算 ”用 以 下 程序 代替 ) ,如 设 


opt= odeset('reltol', le — 6,'abstol', 1e— 9); 
[t,xl= ode45( @jisi, ts ,x0, opt); 


得 到 表 4. 2 和 右边 的 z(t), y(t) ,与 走私 船 到 达 的 位 置 x1 (1) ,y(t) 相对 照 , 知 1 二 1.6 时 工 ， 
y 与 x1， yi 几乎 一 致 , 可 认为 缉私 艇 追 上 走私 船 . TC1)， y(t) 及 ylz) 的 图 形 见 图 4.3Ca) 和 
图 4. 3(b) ,yl(zx) 为 缉私 艇 的 航线 , 当 工 接近 15 时 航线 几乎 是 正 北方 向 ,形成 沿 走私 船 逃 
向 的 追赶 态势 . 

表 4.2 a=35, b 二 40,c 二 15 时 (1)、(2) 的 数值 解 x(1), y(1) 和 y, (1) 


t ZX(1) y(t) y1(t) X(t) y(t) 
0 0 0 0 0 0 
| 十 + 
0. 1 3. 9561 0. 5058 3.5 3.956104 0.505813 
0. 2 7, 5928 2. 1308 7.0 | 7.592822 2.130678 
0. 3 10. 5240 4. 8283 10.5 10. 521921 4. 829308 
0.4 | 12.5384 8.2755 14.0 12. 539454 8.269840 
0.5 13.7551 12.0830 17.5 13.753974 12.075344 
| : | 
1.0 | 14. 9888 32.0163 | 35.0 14. 990167 32. 000013 
1.] | 14. 9996 36.0164 38.5 14. 997715 36. 000005 
2 14. 9986 | 40.0164 42.0 lr 14.999616 40. 000005 
1.3 14. 9996 | 44. 0165 | 45. 5 14.999963 . I 44. 000005 
1.4 15.0117 48. 0183 49 0 | 14.999993 48. 000005 
2 15.0023 52.0146 52.5 14. 999998 52. 000005 
1.6 14. 9866 , 55. 9486 56.0 15. 000020 55.999931 


模型 的 解析 解 ”要 想得到 缉私 艇 拦截 到 走私 船 的 精确 时 间 和 位 置 ,必须 对 模型 (1) 
作 进 一 步 的 分 析 , 设 法 得 到 某 种 形式 的 解析 解 . 
将 方程 (1) 的 两 式 相 除 ,消去 d 得 到 


Cy di 0027) 
人 


《27) 式 对 工 求 导 得 


实验 4 常 微分 方程 数值 解 


MD 


Xx) 


0 0.5 1.0 1.5 2.0 
(a) x(), VD (b) y(x) 


图 4.3 模型 (1)、(2) 的 解 (a==35,b 二 40,c 二 15) 
dy dt 


(一 Z) gz (28) 


为 消去 式 中 的 db， 利用 曲线 弧 长 的 微分 d 一 V(dz) 十 (dy) ， 缉私 艇 的 速度 平一 ,以 及 


2 
Cz) 一 + ( 玉 ) | (29) 


这 是 关于 y(z) 的 二 阶 微分 方程 , 若 令 p 一 罚 , 可 化 为 p(x) 的 一 阶 微分 方程 


a ph VITP 0 (30) 
依 题 意 其 初始 条 件 为 
5 (31) 
方程 (30) 为 可 分 离 变 量 方程 ,容易 求 得 在 (31) 式 下 的 解 为 
Vi 六 +p= (AE), (32) 
或 
Vip —p= (=). (33) 
由 (32) 式 , (33) 式 得 


?= | ( 守 <) 站 (Sz) ]. (34) 
对 (34) 式 积分 并 注意 到 y(0)=0 得 


,re 


这 就 是 缉私 艇 航线 的 解析 表达 式 . 


4.3 龙 格 - 库 塔 方法 的 MATLAB 实现 


: 辣 J ke QOC 
由 (35) 式 知 , 当 z=c 时 ,y i 


度 是 a, 所 以 缉私 艇 拦截 到 走私 般 的 时 间 为 
bce 


pp’ —a? ” 
从 (36) 式 容易 算出 ,a 二 20,4b 二 40,c 二 15 时 ,1 0.5;a 35,0 40 ,c= 15 时 ,zi 二 
1. 6. 由 于 累积 误差 的 影响 ,上 面 的 数值 计算 结果 与 这 个 精确 值 有 一 点 差距 . 
4.5 节 实 验 练 习 中 第 6 题 给 出 了 一 些 值得 进一步 研究 的 问题 . 


4.3.2 弱肉强食 ( 续 ) 


类 似 于 4.3.1 节 ,对 于 4.1.2 节 的 模型 (3) ,也 先 求 其 数值 解 ,再 研究 其 解析 解 . 

模型 的 数值 解 ”为 了 考察 模型 (3) 描 述 的 食 饵 和 捕食 者 密度 随时 间 的 演变 过 程 ,选取 
模型 参数 r= 二 1,d 二 0.5, cc 一 0.1;0=0.02,zo 一 25, 一 2, 用 MATLAB 求 方程 (3) 的 数值 
解 , 记 (1) 一 z，z(2) 一 y，xz 一 (z(1)，z(2)). 编写 如 下 M 文件 : 


,这 也 是 走私 船 的 y 坐标 . 因为 走私 船 速 


(36) 


Lh 


function xdot= shier(t, x) 
r=1;d=0.5;a=0.1;b=0.02; 
xdot= diag([r—ax x(2),—d+bxx(1)]) *x; % 以 向 量 形式 表示 方程 (3) 


然后 运行 以 下 程序 : 


ts=0:0.1:15; % t 的 终 值 经 试验 后 定 为 15. 
x0= [25,2]; 

[t,x|]= ode45(@ shier,ts,x0); 

Lt,xj 

plot(t,x) ,grid, 

gtextC'\fontsize{ 12}x(t)') ,gtextC'\fontsize{ 12}y(Ct)'), % 将 标记 x(t) ,y(t) 的 字体 放大 
pause ,plot(xC : ,1),xC : ,2)) ,grid, 

xlabel('x') , ylabel('y') 


得 到 的 数值 结果 从 上 略 ,zx(zt)，y(2) 及 y(z) 的 图 形 见 图 4.4, 曲 线 >(z) 称 相 轨 线 ,图 形 


称 相 图 . 
从 图 4.4 可 以 猜测 ,z(t)，y() 是 周期 函数 ，y(zx) 是 封闭 曲线 ,并 且 从 数值 结果 可 以 
确定 周期 约 为 10.7, 还 可 以 用 数值 积分 算出 z(1) ,y(t) 在 一 个 周期 的 平均 值 z,y, 得 到 
ze25,y210, 它 们 代表 食 饵 和 捕食 者 的 平均 密度 . 
模型 的 解析 解 ” 为 了 证 明 食 饵 和 捕食 者 密度 z(t)，y() 确实 是 周期 函数 ,必须 从 模 
型 (3) 出 发 ,得 到 相 轨 线 y(z) 的 解析 解 . 
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100. 30 
80 25 
xX(1) 
0 | 20 
~ 15 
40 
10 
20 5 
0 5 10 15 0 20 40 60 8 100 


图 4.4 r=1,d 二 0.5,4 二 0.1,b6 二 0.02 时 x(t) ,y(tf) 及 y(x) 的 图 形 


由 方程 (3) 消 去 d 后 得 到 经 一 -人 于 全 2 ,是 可 分 离 变 量 方程 


(一 d 十 2z) 
: Tdi, rgy. (37) 
工 y 
两 边 积分 得 到 y(x) 的 通 解 
(zidee)(ye2) 一 cc， (38) 


其 中 常数 c 由 初始 条 件 确 定 . 可 以 证 明 ,c 在 一 定 范围 内 时 (38) 式 表示 的 曲线 是 封闭 曲 
线 [ 引 ,这 等 价 于 z(t) ,y(t) 是 周期 函数 . 

食 饵 和 捕食 者 的 平均 密度 zx,y 也 可 以 解析 地 得 到 . 记 zx(z) ,y(t) 的 周期 为 全 ,为 了 求 
zt 在 一 个 周期 的 平均 值 ， 将 模型 (3) 中 的 y= 二 一 (4 一 bx)y 改写 作 


ee 于 (之 +d)- (39) 
两 边 在 周期 工 内 积分 ,容易 算出 xz(z) 平 均值 为 
时 | rd i i 


类 似 地 可 得 y(#) 在 一 个 周期 的 平均 值 


dT\ 
二 ) 区. (40) 


2 
?二 本， (41) 


当 参 数 /二 1,d 二 0,5,4 二 0.1,6 二 0, 02 时 可 得 z= 二 25,y 二 10, 与 上 面 的 数值 结果 一 

注意 到 在 模型 (3) 中 vx 是 食 饵 的 增长 率 ,a 是 捕食 者 的 死亡 率 ,a 反映 捕食 者 对 食 饵 的 
捕获 能 力 , 反映 食 饵 对 捕食 者 的 喂养 能 力 ,(40) 式 和 (41) 式 表明 ,捕食 者 密度 (平均 值 ) 
与 食 饵 增长 率 成 正比 ,与 它 的 捕获 能 力 成 反比 ; 食 饵 密度 (平均 值 ) 与 捕食 者 死亡 率 成 正 
比 ,与 它 的 喂养 能 力 成 反比 . 这 就 是 自然 界 中 食 饵 -捕食 者 系统 存在 的 既 相 互 制约 、 又 相 
互 依存 的 关系 . 


4.4 算法 的 收敛 性 ,稳定 性 及 刚性 方程 


4.4 算法 的 收敛 性 、 稳 定性 及 刚性 方程 


4.2 节 中 欧 拉 方 法 和 龙 格 - 库 塔 方法 的 共同 点 是 ,计算 y,+1 时 只 用 到 y, 一 步 的 信息 ， 
统称 为 单 步 法 . 而 事实 上 ,此 时 yy 2 都 已 经 知道 ,人 们 自然 会 想到 ,如 果 充 


分 利用 前 面 若干 步 的 信息 计算 y,+, , 则 可 望 提高 数值 解 的 精度 ,这 就 是 所 谓 多 步 法 . 本 节 


只 讨论 单 步 法 的 收敛 性 和 稳定 性 ,并 由 此 引出 刚性 现象 与 刚性 方程 . 
4.4.1 单 步 法 的 收敛 性 和 整体 误差 


各 种 数值 方法 都 是 通过 离散 化 的 手段 ,将 微分 方程 化 为 差分 方程 来 求解 的 . 人 们 自然 


希望 , 当 计算 步 长 h 一 0 时 ,差分 方程 能 无 限 逼 近 微 分 方程 ,数值 解 y, 能 无 限 接近 微分 方 
程 初 值 问题 的 解析 解 y(z,) ,这 就 是 收敛 性 问题 . 
4.2 节 中 给 出 的 各 种 ( 显 式 ) 单 步 法 均 可 写成 如 下 形式 
yr = yt hp x, yn sh), 
y(xo), 
其 中 p 称 为 增 量 函数 . 若 对 任 一 固定 的 zx, 王 xo 十 nh 都 有 limy, 一 >(z,) , 则 称 该 方法 是 收 
敛 的 . 注意 ,对 于 一 定 的 z,,n~>co 等 价 于 A->0， 
我 们 知道 ,局 部 截断 误差 是 假定 上 一 步 没 有 误差 的 条 件 下 ,只 考虑 一 步 计算 时 近似 解 
”和 精确 解 之 差 . 当局 部 截断 误差 为 OC(h**!1) 时 ,算法 具有 zp 阶 精度 .而 收 合 性 是 指 n 一 co 时 
误差 6, 二 ylx,) 一 y, 习 0. 这 里 误差 6, 称 为 整体 误差 . 
关于 单 步 法 的 收敛 性 和 整体 误差 有 以 下 结论 六 ， 
若 一 种 单 步 法 (42) 具 有 妨 阶 精度 , 增 量 函 数 对 y 满足 李 普 希 茨 条 件 , 即 存在 工 >0 使 
gx sy;h) 一 p(x;y;h)| 声 L|y 一 y|, 则 该 法 是 收 化 的 , 且 整 体 误 差 
e = IX) — ys = OU). (43) 
由 此 可 知 ,向 前 欧 拉 公 式 (6)、 改 进 欧 拉 公 式 (9)、4 阶 龙 格 - 库 塔 公 式 都 是 收 伍 的 , 它 
们 的 整体 误差 分 别 为 OC(h) ,OCh?) ,OCh'). 


4.4.2 单 步 法 的 稳定 性 


收敛 性 的 讨论 是 在 假设 每 步 计算 都 是 精确 的 前 提 下 ,估计 离散 化 所 产生 的 截断 误差 ， 
没有 考虑 计算 过 程 中 的 含 人 误差 . 而 实际 计算 中 舍 入 误差 是 不 可 避免 的 ,有 时 还 会 随 计算 
步 数 的 增加 而 无 限 地 增 大 ,从 而 使 计算 结果 完全 失真 . 稳定 性 是 讨论 这 种 误差 能 否 被 控制 
的 问题 . 

若 一 种 数值 方法 计算 得 到 的 函数 值 y, 有 误差 6, ,而 在 以 后 得 到 的 yw+e(R 一 1,2，…) 
的 误差 e+x 满 足 |s+e| 委 js , 则 称 该 方法 是 稳定 的 ， 


(42) 
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对 于 一 阶 微分 方程 (4) , 若 在 某 一 点 (六 ,y" ) 作 二 元 泰勒 展开 , 略 去 2 阶 及 2 阶 以 上 
项 得 


y = fr sy) fr sy) (rr) flr yy es y" ). (44) 
再 经 过 简单 的 变量 代 换 ,可 化 成 如 下 的 方程 进行 讨论 ; 
y 一 一 Miy， A 0. (45) 
它 的 解析 解 是 y 一 ce ,ce 是 由 初始 条 件 决 定 的 常数 ,一 4 是 方程 (45) 的 特征 根 ,>0 是 为 
了 保证 微分 方程 本 身 的 稳定 性 . 


下 面 考 察 用 向 前 和 向 后 欧 拉 公 式 求解 方程 (45) 时 的 稳定 性 条 件 . 

方程 (45) 的 向 前 欧 拉 公式 为 y+ 二 yy 一 hAys 二 (1 一 Ah)y,. 车 y, 有 误差 6,, 即 计算 得 
到 的 是 y, 一 > 十 8, 将 y, 代入 公式 计算 得 ys 二 (1 一 4)y, ,于 是 y+i 的 误差 为 e+ 一 
yo 一 yi 一 (1 一 Mi) 和 一 (1 一 Mo 一 (1 一 MP)e 显然 ,为 保证 误差 不 增长 ,只 需 选 取 有 
充分 小 ,使 11 一 内 | 委 1, 它 等 价 于 


h < 2/). (46) 
这 就 是 用 I 


方程 (45) 的 向 后 欧 拉 公 式 为 Ynti = Yn — hAyn+ ,容易 得 到 €n+1 一 es ,其 稳定 性 


条 件 为 | 区 | 坟 1, 而 这 对 于 任意 的 都 是 成 立 的 , 即 向 后 欧 拉 公 式 是 无 条 件 稳定 的 


可 以 证 明 ,对 于 方程 (45) 的 4 阶 龙 格 - 库 塔 公式 (21) 的 稳定 性 条 件 是 
h < 2.785/). (47) 


4.4.3 刚性 现象 与 刚性 方程 
现象 ” 先 看 以 下 的 例子 . 
振动 系统 或 包含 电容 .电感 .电阻 的 电路 系统 的 数学 模型 一 般 可 表 为 
[Tt 十 婚 十 rr = f(1) (k,r > 0)， 
ts 一 az(0) = 0. 
在 给 定 的 一 组 参数 二 2000.5, r 二 1000, a 二 1, 0 一 一 1999.5 和 f(z) 二 1 下 ,其 解 为 0 


(48) 


z(t) = er 一 -2 十 1. (49) 
右 端 第 1,2 项 为 瞬 态 解 ,:->co 时 它们 趋 于 零 , 第 3 项 为 稳 态 解 . 瞬 态 解 中 Se 


解 ,时 间 常 数 为 二 1/2000 二 0. 0005, 计 算 到 t==105 一 0. 005 时 该 项 已 衰减 到 4 
10“; 另 一 项 e” 称 慢 瞬 态 解 , 时 间 常 数 为 一 2, 计 算 到 上 一 10m 一 20 时 
4.5X10-5. 


”为 方便 起 见 , 我 们 了 到 这 个 有 解析 解 的 情况 说 明 数 值 解 中 的 问题 . 


4.4 ”算法 的 收 合 性 、 稳 定性 及 刚性 方程 


OL dt 解 , 当 用 数值 方法 求解 这 个 问题 时 ,精度 要 达到 10 就 至 少 
需要 算 到 1 二 20, 这 是 由 慢 瞬 态 解 的 特征 根 决 定 的 (IX| 三 1/2). 如 何 选 取 步 长 h 呢 ?” 从 解 
的 稳定 性 看 ,完全 由 快 阴 态 解 的 特征 根 决定 (|4| 二 2000). 若 用 向 前 欧 拉 公式 计算 ,按照 
(46) 式 应 有 有 二 2/2000==0., 001; 用 龙 格 - 库 塔 公 式 计算 ,按照 (47) 式 应 有 hh 过 2. 785/2000 
二 0. 0014, 那么 算 到 :二 20 就 需要 14286 步 .这样 大 的 计算 量 是 由 于 快 瞬 态 解 和 慢 瞬 态 解 
的 衰减 速度 ( 即 两 个 特征 根 ) 相 差 悬 殊 ( 例 中 是 4000 倍 ? 造 成 的 ,这 种 现象 称 为 刚性 现象 ， 
相应 的 微分 方程 称 为 刚性 方程 . 

另外 ,由 数值 解法 的 误差 分 析 可 知 , 误 差 项 包含 着 方程 的 解 ( 喇 数 ) 的 高 阶 导 数 , 快 瞬 
态 解 e-* 的 n 阶 导数 项 合 %"e*, 当 4 很 大 时 这 一 项 比 解 本 身 大 得 多 ,为 了 使 数值 解 保 持 
一 定 的 精度 就 需要 很 小 的 计算 步 长 , 当 由 慢 瞬 态 解 决定 的 计算 区 间 较 大 时 ,就 会 给 整个 的 
数值 求解 带 来 很 大 的 困难 . 

刚性 方程 ”振动 .电路 及 化 学 反应 中 出 现 刚性 现象 的 线性 常 系数 方程 组 可 表 为 

x(t) 一 4x 十 大 (1 (50) 

其 中 x,， 了 是 n 维 向 量 ,4 是 n Xn 矩阵. 当 4 的 特征 根 A《& 二 1,2,…,n) 的 实 部 RelXi) 均 
为 负数 时 ,方程 通 解 中 对 应 于 |Re(X4)| 的 值 大 的 项 为 快 瞬 态 解 , 值 小 的 项 为 慢 瞬 态 和 解 , 称 

max | ReCAe) | 

min Re 


为 刚性 比 . s* 之 10 的 方程 便 可 认为 是 刚性 方程 ,实际 问题 中 可 出 现 * 达 105 的 情况 . 

显然 ,刚性 是 问题 本 身 的 性 质 ,与 解法 无 关 , 但 正 是 由 于 这 种 性 质 ,用 数值 方法 求解 时 
需要 计算 到 最 慢 瞬 态 解 豪 减 成 可 忽略 的 小 量 为 止 ,使 得 积分 区 闻 很 长 ,而 为 了 保证 计算 的 
稳定 性 , 当 最 快 瞬 态 解 的 |Rel44) | 很 大 时 ,又 必须 使 步 长 充分 小 ,这 就 出 现 了 在 大 区 间 上 
用 小 步 长 计算 的 困难 情况 ,传统 的 数值 方法 无 能 为 力 , 需 要 考虑 另外 的 办 法 ， 

对 于 非 线性 方程 组 的 刚性 ,可 以 用 线性 化 的 办 法 在 精确 解 的 邻 域 内 用 常 系数 方程 组 
来 近似 处 理 . 

MATLAB 求解 ” 当 用 MATLAB 软件 中 通常 求解 常 微分 方程 的 命令 ode23 ，ode45 
时 ,由 于 其 步 长 是 按照 稳定 性 的 要 求 和 指定 的 精度 加 以 调整 的 ,所 以 用 它们 解 刚性 方程 时 
步 长 会 自动 变 小 ,对 于 大 的 区 间 会 导致 计算 时 间 很 长 . MATLAB 中 备 有 用 另外 的 方法 编 
制 的 专门 求解 刚性 方程 的 命令 ode23s，ode15s 等 ,其 用 法 与 ode23, ode45 相同 . 可 从 下 
面 的 例子 观察 这 些 专用 程序 的 效果 . 


(51) 


Z1 = Xl 二 27， oe 
上 二 一 (105 十 1)zxi 一 (105 十 2)xs， (52) 
Xx1(0) = 105/4,x2(0) = 10°/4— 1/2. 

特征 根 入 二 一 1,Xs 二 一 10" ,刚性 比 * 王 10 .方程 (52) 的 解析 解 为 
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| za = (E+) ee, 

(53) 
(105 + 1) _ios， 
pe 
在 下 面 的 程序 里 我 们 先 计算 解 析 解 (53) (结果 输出 为 A) 用 作 比 较 ,然后 用 专门 的 程序 
ode23s 解 方 程 (52) (结果 输出 为 B) ,最 后 用 普通 的 程序 ode23 解 方程 (52) (结果 输出 为 
C) . | 


z(t) 一 一 (E+)e+ 


作为 试探 , 取 计 算 区 间 为 L0, 1], 可 以 看 到 ,结果 A,B 立刻 计算 出 来 ,结果 C 则 需要 
几 十 秒 钟 . 而 为 了 使 解 (53) 中 的 快 瞬 态 解 训 减 到 足够 小 ,至 少 要 将 计算 区 间 扩 大 为 [0， 
10j] ,你 会 发 现 , 用 ode23s 仍 能 很 快 得 到 结果 (注意 这 时 不 要 用 ode23, 否 则 会 陷入 无 法 忍 
耐 的 等 待 1). 

~ function dx= stiff1(t,x) 

dx=[xC1) +2xx62);— (10°6+ 1) *x(1) 一 (10"6 十 2) * X(2)]; 


t=0:0.1:1; 

x1= (10°6/4+1) x exp(—t)—exp(— 10°6 *t); 

x2= — (10°6/4+1)x* exp(—t)+ (10°6+ 1)/2* exp(— 10°6 * t); 
A= [t;x1;x2]' 

x0=[10°6/4,10°6/4— 1/2]; 

[t,x]= ode23s(@ stiffi ,t,x0); 

B= [t,x] 

[ty]=ode23(@stiffl,t,x0); 

C=Lt,y] 


4.5 实验 练习 


实验 目的 
. 掌握 用 MATLAB 软件 求 微分 方程 初 值 问题 数值 解 的 方法 ; 

2. 通过 实例 学 习 用 微分 方程 模型 解决 简化 的 实际 问题 ; 

3, 了 解 欧 拉 方 法 和 龙 格 - 库 塔 方法 的 基本 思想 和 计算 公式 ,及 稳定 性 等 概念 . 

实验 内 容 

1. 用 欧 拉 方 法 和 龙 格 - 库 塔 方法 求 下 列 微分 方程 初 值 问 题 的 数值 解 , 画 出 解 的 图 形 ， 
对 结果 进行 分 析 比 较 . 

Si Rd 


1 (0 委 z 委 1)， 精 确 解 y= 二 3e 一 2x 一 2; 
> 一 上 ， . 


人 a 
(2) ' Ee 
y(0) 二 0 或 y(0)==1; 


zy ry tr —n)y=0, 
(3) x /x > 〔 贝 塞 尔 方程 , 令 n=0.5), 精确 解 y* 一 sinz 、/ 空 . 
| )=2,»’( )= 一 元 . A i 


9 


nt 


2 2 

2. 小 型 火箭 初始 重量 为 1400kg, 其 中 包括 1080kg 燃料 . 火箭 竖 直 向 上 发 射 时 燃料 
燃烧 率 为 18kg/s, 由 此 产生 32000N 的 推力 ,火箭 引擎 在 燃料 用 尽 时 关闭 . 设 火箭 上 升 时 
空气 阻力 正比 于 速度 的 平方 ,比例 系数 为 0. 4kg/m, 求 引擎 关闭 瞬间 火箭 的 高 度 .速度 、 
加 速度 ,及 火箭 到 达 最 高 点 时 的 高 度 和 加 速度 ,并 画 出 高 度 . 速度. 加 速度 随时 间 变 化 的 
图 形 . 

3. 某 容器 盛 满 水 后 , 底 端 直径 为 do 的 小 孔 开 启 ( 见 图 4. 5). 根据 水 力学 知识 , 当 水 面 高 
度 为 时 ,水 从 小 孔 中 流出 的 速度 为 v=0.6 Vgh (g 为 重力 加 速度 ,0. 6 为 孔 口 收缩 系数 ). 

(1) 车 容器 为 倒 圆 锥 形 ( 见 图 4. 5(a)), 现 测 得 容器 高 和 上 底面 直径 均 为 1. 2m, 小 孔 
直径 为 3cm, 问 水 从 小 孔 中 流 完 需 要 多 少时 间 ;2min 时 水 面 高 度 是 多 少 . 

(2) 车 容器 为 倒 戎 芦 形 (图 4.5(b)), 现 测 得 容器 高 1. 2m, 小 孔 直 径 3cm, 由 底 端 ( 记 
作 z 一 0) 向 上 每 隔 0. 1m 测 出 容器 的 直径 DCm) 如 表 4. 3 所 示 , 问 水 从 小 孔 中 流 完 需 要 多 
少时 间 ;2min 时 水 面 高 度 是 多 少 . 


4.3 
0.03 0.14 | 0.19 | 0.33 | 0.45 | 0.68 | 0.98 | 1.10 | 1.20 1.13 


4. 放射 性 废物 的 处 理 : 有 一 段 时 间 , 美 国 原子 能 委员 会 ( 现 为 核 管理 委员 会 ) 处 理 浓 
缩放 射 性 废物 时 ,把 它们 装 和 密封 性 能 很 好 沁 4 
的 圆 桶 中 ,然后 扔 到 水 深 300ft@ 的 大 海中 ， 
这 种 做 法 是 否 会 造成 放射 性 污染 ,自然 引起 
生态 学 家 及 社会 各 界 的 关注 . 原子 能 委员 会 
一 再 保证 , 圆 桶 非常 坚固 , 绝 不 会 破 漏 ,这 种 
做 法 是 绝对 安全 的 . 然而 一 些 工程 师 们 却 对 
此 表示 人 怀疑 ,认为 圆 桶 在 和 海底 相 撞 时 有 可 
能 发 生 破 裂 . 于 是 双方 展开 了 一 场 笔 墨 (a) 倒 圆 锥 形容 器 (b) 倒 戎 芦 形容 器 
官司 . 图 4.5 第 3 题 图 


个 ft; 英尺 ,1ft 二 0. 3048m 
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究竟 谁 的 意见 正确 呢 ? 原子 能 委员 会 使 用 的 是 55galo 的 圆 桶 , 装 满 放 射 性 废物 时 的 
圆 桶 重量 为 527. 4361bf@ ,在 海水 中 受到 的 浮力 为 470. 327 lbf. 此 外 ,下 沉 时 图 桶 还 要 受 . 
到 海水 的 阻力 ,阻力 与 下 沉 速 度 成 正比 ,工程 师 们 做 了 大 量 实 验 , 测 得 其 比例 系数 为 
0. 081bf s/ft. 同时 ,大 量 破坏 性 实验 发 现 当 圆 桶 速度 超过 40ft/s 时 ,就 会 因 与 海底 冲撞 而 
发 生 破裂 . 

(1) 建立 解决 上 述 问题 的 微分 方程 模型 

(2) 用 数值 和 解析 两 种 方法 求解 微分 方程 ,并 回答 谁 赢 了 这 场 官 司 . 

5. 一 只 小 船 渡 过 宽 为 & 的 河流 (图 4.6) ,目标 是 起 点 A 正 对 着 的 另 一 岸 B 点 .已 知 
河水 流速 w 与 船 在 静水 中 的 速度 w 之 比 为 

(1) 建立 措 述 小 船 航线 的 数学 模型 , 求 其 解析 解 ; 

(2) 设 d 二 100m,wv 二 1m/s,v, 二 2m/s, 用 数值 解法 求 
渡河 所 需 时 间 ,任意 时 刻 小 船 的 位 置 及 航行 曲线 , 作 图 ,并 与 
解析 解 比 较 ; 

(3) 车 流速 一 0,0.5，1.5，2(my/s) ,结果 将 如 何 . 

6. 4.1.1 节 海上 缉私 问题 的 进一步 研究 . 

对 以 下 两 种 情况 建立 缉私 艇 位 置 和 航线 的 数学 模型 , 自 
己 设 定 速度 等 参数 , 求 数值 解 : 图 4.6 小 船 过 河 

(1) 若 走 私 船 沿 着 与 正 东 方向 成 某 一 角度 的 直线 行驶 ; 

(2) 车 走私 船 仍 向 正 北方 向 行驶 ,一 段 时 间 ( 设 尚未 被 缉私 艇 追 上 ) 后 又 掉头 返回 

(3) 讨论 走私 船 和 缉私 艇 位 于 任意 初始 位 置 ， 人 

7. 适当 改变 4.1. 2 节 弱 肉 强 食 中 的 参数 r,da,p,zo,yo, 讨 论 它 们 对 周期 的 影响 . 

8. 两 种 群 相 互 竞争 模型 如 下 : 


X(N = nz (1 Et | 


1 
1 
T 
了 
1 
1 
1 
了 
1 
1 
了 
1 
1 


y(t) = ry (1—s > 


其 中 x(t) ,y() 分 别 为 甲乙 两 种 群 的 数量 ,ri ,ri 为 它们 的 固有 增长 率 ,n,n 为 它们 的 最 
大 容量 . s, 的 含义 是 ,对 于 供养 甲 的 资源 而 言 ,单位 数量 乙 ( 相 对 n;) 的 消耗 为 单位 数量 甲 
(相对 nm) 消耗 的 51 倍 , 对 s 可 作 相 应 的 解释 . 

该 模型 无 解析 解 , 试 用 数值 解法 研究 以 下 间 题 ; 

(1) 设 放 二 二 1 yn 二 7 二 100,51 二 0,5,5s 二 2, 初 值 x 二 yo 二 10, 计 算 x(),y(z), 夯 


gal: 加 仑 ,lgal==3.7851.( 美 制 ). 
@ 1bf: 磅 力 ,1lbf 一 0. 4536kg. 
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出 它们 的 图 形 及 相 图 (x,y) ,说 明 时 间 1t 充 分 大 以 后 x+(z),y(z) 的 变化 趋势 (人 们 今天 看 到 
的 已 经 是 自然 界 长 期 演变 的 结局 ). 

(2) 政变 者 ;r2 ,nyn2z ,Xo，Yyo ;但 $5,5z 不 变 ( 或 保持 5s 二 1,s, 之 1) ,计算 并 分 析 所 得 结 
果 ; 若 5 二 1.5( 之 1) ,ss 二 0.7( 达 1), 再 分 析 结 果 . 由 此 你 能 得 到 什么 结论 ,请 用 各 参数 生 
态 学 上 的 含义 作出 解释 . 

(3) 试验 当 5 二 0.8( 过 1),s, 王 0.7( 过 1) 时 会 有 什么 结果 ; 当 5 二 1. 5 之 1),ss= 二 1.7 
(之 DD 时 又 会 有 什么 结果 . 能 解释 这 些 结果 吗 ? 

9. 对 下 列 3 级 龙 格 - 库 塔 方法 : 


Yrtl 一 yn 十 Sk 十 ks) ? 


ki = f(x yn), 

kz 二 f(z 十 专 ,y 十 胡 k1)， 

ks = fz (1—ih,y, dt (1—thk]. 
试 证 明 对 于 任意 的 参数 ,此 方法 均 为 2 阶 ,给 出 其 局 部 截断 误差 主 项 ,并 讨论 :一 1 时 方 
法 的 稳定 性 . 
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线性 代数 方程 组 的 数值 解法 


工程 技术 .自然 科学 以 及 社会 经 济 领域 中 的 许多 问题 常常 归结 为 求解 大 型 的 线性 代 
数 方程 组 (以 下 简称 线性 方程 组 ) :如 土木 结构 、 输 电网 络 、 经 济 的 投入 产 出 生物 的 种 群 繁 
殖 、 实 验 分 析 中 的 数据 拟 合 ,以 及 用 差分 法 或 有 限 元 法 解 偏 微分 方程 等 . 虽然 , 解 线性 方程 
组 是 大 家 早 在 中 学 数学 课 里 就 已 熟悉 的 内 容 , 线 性 方程 组 的 理论 也 在 线性 代数 课 里 学 习 
过 ,但 是 那里 的 知识 远 不 能 满足 解决 实际 问题 的 需要 ,大 型 的 线性 方程 组 通常 要 用 数值 方 
法 求解 . 

以 下 5.1 节 给 出 几 个 实例 并 建立 数学 模型 ;5. 2 节 是 求解 线性 方程 组 的 直接 法 ,包括 
”病态 问题 的 简单 讨论 ;5. 3 节 介 绍 求解 线性 方程 组 的 迭代 法 ;5. 4 节 通 过 数据 拟 合 讨论 超 
定 线性 方程 组 的 最 小 二 乘 解 ;5. 5 节 介绍 线性 方程 组 数值 解法 的 MATLAB 实现 ,并 完成 
5.1 节 的 三 个 模型 的 求解 ;5. 6 节 布 置 实验 练习 . 


5.1 实例 及 其 数学 模型 


5.1.1 投入 产 出 分 析 

问题 ”国民 经 济 各 个 部 门 之 间 存在 着 相互 依存 的 关系 ,每 个 部 门 在 运转 中 将 其 他 部 
门 的 产品 或 半成品 ( 称 为 投入 ) 经 过 加 工 变 为 自己 的 产品 ( 称 为 产 出 ) ,如 何 根据 各 部 门 间 
”的 投入 产 出 关系 ,确定 各 部 门 的 产 出 水 平 ,以 满足 社会 需求 ;是 投入 产 出 分 析 中 研究 的 课 
题 , 为 了 具体 说 明 投入 产 出 中 的 数量 关系 ,考虑 下 面 的 例子 . 

设 国 民 经 济 由 农业 、 制 造 业 和 服务 业 三 个 部 门 构成 ,已 知 某 年 它们 之 间 的 投入 产 出 关 
系 、 外 部 需求 .初始 投入 等 如 表 5. 1 所 示 ( 数 字 表 示 产 值 ). 

表 中 第 一 行 数字 表示 ,农业 总 产 出 100 亿 元 ,其 中 15 亿 元 农产品 用 于 农业 生产 本 身 
(如 提供 种 子 ) ,20 亿 元 用 于 制造 业 ( 如 提供 木材 毛皮) ,30 亿 元 用 于 服务 业 , 剩 下 35 亿 元 
农产品 用 来 满足 外 部 需求 (包括 消费 、 积 累 、 出 口 等 ). 第 一 列 数 字 中 ,15 亿 元 如 前 所 述 ， 
30 亿 元 是 制造 业 对 农业 的 投入 (如 提供 农具 ) ,20 亿 元 是 服务 业 对 农业 的 投入 ,35 亿 元 的 
初始 投入 包括 工资 ,税收 、 进 口 等 ,总 投入 100 亿 元 与 总 产 出 相等 . 


5.1 实例 及 其 数学 模型 


表 5.1 国民 经 济 三 个 部 门 间 的 关系 单位 : 亿 元 


投入 制造 业 | 服务 业 外 部 需求 总 
农业 15 20 30 35 100 
制造 业 30 10 45 115 200 

“ke 
服务 业 20 60 0 70 150 
初始 投入 35 110 75 
二 
总 投入 100 200 150 


假定 每 个 部 门 的 产 出 与 它 的 投入 成 正比 ,由 表 5. 1 能 够 确定 这 三 个 部 门 的 投入 产 出 
表 , 如 表 5. 2， 


表 5.2 三 个 部 门 的 投入 产 出 表 


投入 .2 农业 制造 业 服务 业 
农业 1 0.10 . 0. 20 
制造 业 0. 30 0.05 0. 30 
服务 业 0. 20 0. 30 0 


表 中 第 一 行 、 第 二 列 的 数字 0. 10 表示 ,生产 1 个 单位 产值 的 制造 业 产品 需 投入 0. 10 个 单 
位 产值 的 农产品 ,这 是 由 表 5. 1 中 20 亿 元 农产品 投入 制造 业 , 可 以 产 出 200 亿 元 制造 业 
总 产值 而 来 的 (20/200 二 0.1). 同样 ,第 三 行 、. 第 一 列 的 数字 0. 20 表示 ,生产 1 个 单位 产值 
的 农产品 需要 0. 20 个 单位 的 服务 业 产 值 , 因 为 表 5. 1 中 20 亿 元 的 服务 业 产值 投入 农业 ， 
得 到 100 亿 元 的 农业 总 产值 . 表 5. 2 的 数字 称 为 投入 系数 或 消耗 系数 ,在 技术 水 平 没 有 明 
显 提 高 的 情况 下 ,可 以 假设 投入 系数 是 常数 ， 

《1) 如 果 今 年 对 农业 .制造 业 和 服务 业 的 外 部 需求 分 别 为 50，150，100 亿 元 , 问 这 
个 部 门 的 总 产 出 分 别 应 为 多 少 ? 

(2) 如 果 三 个 部 门 的 外 部 需求 分 别 增加 1 个 单位 ， 问 它 们 的 总 产 出 应 分 别 增加 多 少 ? 

(3) 投入 产 出 分 析 称 为 可 行 的 ,是 指 对 于 任意 给 定 的 . 非 负 的 外 部 需求 ,都 能 得 到 非 
负 的 总 产 出 .为 了 可 行 ,投入 系数 应 满足 什么 条 件 ? 

模型 ” 设 有 7 个 部 门 , 记 一 定时 期 内 第 i 个 部 门 的 总 产 出 为 zi;, 其 中 对 第 7 个 部 门 的 
投入 为 xp, 外 部 需求 为 4;, 则 


= Det i = 1.2, ,nn. (1) 
表 5. 1 的 每 一 行 都 满足 (1) 式 . 投入 系数 记 作 aj :出 下 式 定义 


eh 
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Xi = Qi 并 i,j = 12，…)77， (2) 


a 


ee 
a i= 1,2,.,n. (3) 


j=1 

记 投入 系数 矩阵 A 二 (ay ),x， , 产 出 向 量 x 一 (zy,… ,zx,)" ,需求 向 量 4 二 (di,…,d,)", 则 
(3) 式 可 写作 

x 二 Ax 十 d， (4) 
或 

(I—A)x= dd, (5) 
其 中 工 是 单位 矩阵 ， 

当 投入 系数 4 和 外 部 需求 d 给 定 后 ,求解 线性 方程 组 (5) 即 可 得 各 部 门 的 总 产 出 x 

在 5.5 节 中 将 继续 讨论 这 个 问题 . | 


5.1.2 一 年 生 植 物 的 繁殖 ( 续 ) 


问题 2. 2. 1 节 讨论 了 一 年 生 植 物 的 繁殖 ,车 一 棵 植物 秋季 产 种 的 平均 数 为 c, 种 子 
能 够 活 过 一 个 冬天 的 比例 为 5,1 岁 的 种 子 能 在 春季 发 芽 的 比例 为 ai, 两 岁 的 种 子 能 在 春 
季 发 芽 的 比例 为 as ,假定 种 子 最 多 可 以 活 过 两 个 冬天 ,建立 的 是 一 阶 和 二 阶 差分 方程 . 如 
果 在 繁殖 过 程 中 我 们 知道 了 某 一 年 植物 的 数量 ,并 希望 若干 年 后 它 的 数量 达到 给 定 的 规 
模 , 就 需要 在 原来 模型 的 基础 上 改进 , 求 出 第 二 年 (及 以 后 诸 年 ) 这 种 植物 的 数量 . 

模型 ” 记 第 年 的 植物 数量 为 zx; ,实验 2 中 (10) 式 的 第 2 式 给 出 的 模型 为 (到 年 
为 止 ) 

Zt 十 priei 十 gris 一 0， 开 一 2 3: 7 (6) 

其 中 p= 二 一 a1bc，g 王 一 az0(1 一 Qa1)bce. 设 已 知 某 年 有 植物 zx。， 要求 n 年 后 数量 达到 z。 
则 差分 方程 (6) 可 以 改写 为 如 下 的 线性 方程 组 


4x = 二 上， (C7) 
其 中 
rp 1 1 [Zi | | 一 gro | 
dg pp 1 人 2 0 
1 工 0 
es ， x=| |， b= (8) 
9 pp 1 rr 0 
2 PJ Be of By | Er Tn 宙 


为 得 到 第 二 年 (及 以 后 请 年 ) 植 物 的 数量 xi (及 zo，*…，Xw1) 需求 解 线性 方程 组 (7). 这 
里 4 是 稀 琉 矩阵 ( 非 零 元 素 很 少 ) ,处 理 方法 将 在 5. 5 节 中 讨论 ， 


5.2 求解 线性 代数 方程 组 的 直接 法 


5.1.3 汽车 刹车 距离 ( 续 ) 


问题 1.2.1 节 中 经 过 对 汽车 刹车 过 程 的 机 理 分 析 , 在 简化 .合理 的 假设 下 得 到 刹车 
距离 与 车 速 之 间 的 二 次 函数 关系 ,但 是 函数 的 系数 难以 从 机 理 上 确定 . 表 1.1 给 出 了 一 组 
车 速 与 刹车 距离 的 测试 数据 ,由 实际 数据 计算 已 知 函数 关系 中 的 系数 称 为 数据 拟 合 ,是 这 
个 实验 的 任务 之 一 . 
模型 1.2.1 节 建立 了 刹车 距离 4 与 车 速 v 的 关系 : 
d.= kiv 二 kv, (9) 


”其 中 名， ks 为 待定 系数 . 车 速 与 刹车 距离 的 实际 数据 记 作 (v，4d;) (i 二 1,2,…,n)( 见 


表 1.1,n 二 7) ,将 它们 代入 (9) 式 得 线性 方程 组 

di=hv thkv, i=1,2, Nn. (10) 
显然 , 当 数据 容量 n 大 于 待定 系数 个 数 2 时 ,该 方程 组 一 般 没 有 普通 意义 下 的 解 . 5.5 节 
将 讨论 这 种 方程 组 的 最 小 二 乘 解 . 


5.2 求解 线性 代数 方程 组 的 直接 法 


含 7 个 未 知 数 、 由 x 个 方程 组 成 的 线性 方程 组 可 表示 为 
allZl 十 aizZz 十 … 十 az 一 D， 
Q211 re 十 … 十 as 一 Do 
(11) 
aaZl 十 az 十 … 十 anZu 二 b,. 
车 记 4 二 (a5 )sxnsX 王 (zi)Za) 二 (061,…,b,) , 则 线性 方程 组 (11) 可 表示 为 矩阵 一 
向 量 形式 : 
4x = 上， (12) 
4 称 为 系数 矩阵 .求解 线性 方程 组 的 方法 一 般 有 两 类 : 直接 法 和 迭代 法 . 
直接 法 ”经 过 有 限 次 算术 运算 能 求 出 精确 解 (不 考虑 舍 人 人 误差) 或 者 判定 解 不 存在 
的 方法 . 主要 包括 高 斯 消 元 法 和 LU 分 解 . 
迭代 法 ”从 某 个 初始 近似 解 出 发 ,通过 逐次 得 到 的 近似 解 去 至 近 准 确 解 的 方法 . 主要 
包括 雅 可 比 (Jacobi) 方 法 和 高 斯 - 赛 德 尔 (Gauss-Seidel) 方 法 . 


$.2.1 高 斯 消 元 法 
消 元 法 由 消 元 过 程 和 回 代 过 程 组 成 . 用 一 个 数字 例子 说 明 这 两 个 过 程 ; 
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22Zi 十 2z; 一 373 = 9， 
4Zl 十 3zz 一 2a 一 0， (13) 
2X1 十 一 273 Ss 人 
第 1 方程 乘 ( 一 1/2) 加 和 第 2 方程 ,第 1 方程 乘 ( 一 1) 加 和 第 3 方程 ,得 
271 十 2xs 二 人 2 9， 
12zs 十 方 zs 一 六 (14) 
— Es = 一 2. 
第 2 方程 乘 (LI/2) 加 和 人 第 3 方程 ,得 
2z 十 2z 一 37x3 一 9， 
i 
由 (15) 
ER 一 
4 4 


这 就 是 消 元 过 程 . 由 第 3 方程 得 到 z, 一 一 1, 代 入 第 2 方程 得 到 x, 一 1, 再 代入 第 1 方程 得 
到 zj 二 2, 为 回 代 过 程 . 
若 将 方程 组 (13) 一 (15) 表 为 如 (12) 式 那样 的 矩阵 一 向 量 形式 , 则 上 面 消 元 过 程 的 第 


1 0 0 
1 步 相 当 于 (13) 式 左 乘 矩 阵 | 一 1/2 1 0|, 第 2 步 相 当 于 (14) 式 再 左 乘 算 
—1 01 


阵 


1 0 0 
0 1/2 1 


对 于 一 般 的 线性 方程 组 (12), 共 n 一 1 步 的 消 元 过 程 相当 于 依次 左 乘 如 下 的 一 系列 矩 


阵 Ag ? M; 1 M,-! ; 
rl bag | 
1 
a 
Ms = ra ， 上 二 1,2,% ,Rn 一 1， C16) 
apk 
3 1 
CC 
nh 1 
L @ 锥 


空白 处 的 元 素 均 为 0,at(i 一 上 十 1,…,m) 是 第 大 步 消 元 时 第 ; 个 方程 中 习 , 的 系数 ， 
而 < 史 称 为 主 元 , 消 元 中 要 假定 主 元 


5.2 求解 线性 代数 方程 组 的 直接 法 


E00 k=1,2,.,n. (17) 
用 Mi， M, 9 M,-: 依 次 左 乘 (12) 的 结果 是 
AT IT Mi Ax 人 M,_1…M,.M b. (18) 


记 M1 MiMi 一 M, 因 为 Mj, M;,…，M,-1 痢 是 单位 下 三 角 和 矩阵 (对 角 元 素 为 1, 上 三 
. 角 元 素 为 0) ,所 以 M 仍 是 单位 下 三 角 矩 阵 . 当 n 一 1 步 消 元 结束 后 方程 组 (18) 左 边 的 矩阵 
MA 变 为 上 三 角 和 矩阵 (如 线性 方程 组 (15) 的 系数 矩阵 ,其 下 三 角 元 素 为 0), 记 作 忆 .出 
MA =U. (19) 
(18) 式 写作 
Ux = Mb. (20) 

U 的 对 角 元 素 为 a 抽 关 0(k 二 1,2,…,n). 

回 代 过 程 利用 线性 方程 组 (20) 中 UU 是 可 逆 的 上 三 角 和 矩阵 ， 很 容易 按照 Ti-15 
zx! 的 顺序 求解 . 

消 元 法 的 前 提 条 件 是 主 元 不 等 于 零 , 即 (17) 式 ,容易 证 明 它 等 价 于 Ah 的 所 有 顺序 主 
子 式 
Ql we CQIA 


天 0， 有 一 1;2，…po 


i 

实际 上 ,在 用 消 元 法 解 线 性 方程 组 的 过 程 中 ,即使 a 多 隆 0(k 二 1,2,…,n), 但 是 其 绝 
对 值 很 小 时 ,用 它 作 除数 会 导致 很 大 的 舍 人 误差 . 所 以 在 进行 到 第 上 步 消 元 时 ,不 论 a 锥 
是 否 为 0, 都 在 第 & 列 中 选择 |c 知 | (i 二 k,…,n) 最 大 的 一 个 作为 主 元 ( 称 为 列 主 元 ), 将 其 
所 在 行 与 第 & 行 交换 后 再 按 上 述 方法 进行 下 去 , 称 为 列 主 元 消去 法 . 


5.2.2 LU 分 解 


(1) 矩阵 LU 分 解 
因为 线性 方程 组 (19) 中 的 单位 下 三 角 珑 阵 虹 可 道 , 记 工 一 MT 江 仍 为 单位 下 三 角 矩 
阵 ,由 (20) 式 得 
LUx 一 D. (21) 
与 待 解 线性 方程 组 (12)4x==b 相 比 较 可 知 , 消 元 过 程 相当 于 将 系数 矩阵 4 分 解 为 L 与 U 
的 乘积 , 即 有 如 下 结论 . 
如 果 n 阶 和 矩阵 4 的 顺序 主子 式 不 为 零 , 则 人 可 分 解 为 一 个 单位 下 三 角 矩 阵 工 和 一 个 
上 三 角 和 矩阵 辟 的 乘积 
4 一 LU， (22) 
且 分 解 是 惟一 的 ,这 种 分 解 叫 做 矩阵 LU 分 解 . 
线性 方程 组 hx= 忆 的 系数 矩阵 4 实现 LU 分 解 后 ,就 化 为 求解 两 个 简单 的 线性 方 
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程 组 : 
Ly = b, Ux 一 小 (23) 
(2) 经 交换 阵 变 换 的 LU 分 解 
如 果 只 知道 矩阵 4 可 逆 而 不 能 保证 其 顺序 主子 式 不 为 零 ,那么 在 消 元 过 程 中 可 能 会 
遇 到 某 个 a 关 =0 的 情况 ,但 这 时 必 至 少 有 一 个 a 由 关 0(i 二 十 1,…,n) (为 什么 ?), 只 需 像 
列 主 元 消 元 法 那样 ,将 列 主 元 所 在 的 第 i 行 与 第 & 行 交换 后 , 即 可 继续 施行 消 元 过 程 , 而 
这 种 行 交换 相当 于 4 左 乘 一 个 单位 阵 两 行 交 换 的 初等 交换 和 矩阵 ,于 是 将 4 化 为 上 三 角 撼 
阵 上 的 过 程 相当 于 4 左 乘 一 系列 的 初等 交换 矩阵 和 单位 下 三 角 矩 阵 , 记 这 些 初 等 交换 扼 
阵 的 乘积 为 P,P 是 单位 矩阵 经 若干 次 行 交换 的 交换 矩阵, 类似 于 (19) 式 可 得 到 
MPA =U. ; (24) 
仍 记 工 一 M- ,就 得 到 以 下 结论 : 
如 果 4 可 道 , 则 存在 单位 下 三 角 和 矩阵 工 、 上 三 角 和 矩阵 避 和 交换 和 矩阵 己 , 使 
P4 = LU. (25) 
(25) 式 与 (22) 式 的 LU 分 解 只 差 一 个 交换 阵 因子 . 
(3) 对 称 正定 矩阵 的 LU 分 解 
一 些 实际 问题 经 常 妇 结 为 求解 具有 对 称 正定 矩阵 的 线性 方程 组 ,这 时 系数 矩阵 的 


LU 分 解 具 有 更 简单 的 形式 : 
若 4 对 称 正定 , 则 存在 对 角 元 素 为 正 的 下 三 角 和 矩阵 使 
A4=LL’, (26) 
称 为 Cholesky 分 解 . 


(4) 三 对 角 和 矩阵 的 LU 分 解 

在 三 次 样 条 插值 和 其 他 一 些 计算 中 ,会 遇 到 求解 系数 矩阵 4 具有 三 对 角形 式 的 线性 
方程 组 ,这 时 4 的 LU 分 解 ( 假 定 分 解 存在 ) 有 简单 的 计算 公式 ， 

将 4 的 LU 分 解 表 为 


Db a 1 1] pa a 了 
as 0 C2 lil, 1 Us C2 
人 王 一 ls 
Qn Ol Cl 1 Ur Cl 
a vb Li 1 UJ 
(27) 
L 和 U 的 计算 公式 为 


ul = 6, 
| = Qi/ Ui 9 zi 一 23，…71， (28) 


1 b= Lei i 二 2 3，… ,7n. 


5.2 求解 线性 代数 方程 组 的 直接 法 
线性 方程 组 Ax 二 了 可 通过 等 价 的 两 个 三 角形 线性 方程 组 Ly 二 了 和 Ux 王 y 求解 如 下 : 


ee Eee ’ 

(29) 
yi= filyr, i= 2 nN; Zi 一 (一 CH i= nm1,.,]. 
《27) 式 一 (29) 式 称 为 求解 三 对 角形 线性 方程 组 的 追赶 法 ， 


5.2.3 解 的 误差 分 析 


(1) 病态 方程 组 和 病态 矩阵 
由 实际 问题 导出 的 线性 方程 组 4x 一 总 中 ,系数 和 矩阵 4 和 右 端 向 量 b 往往 带 有 误差 
(扰动 ), 解 的 误差 分 析 是 讨论 4 或 b 的 微小 变化 对 解 x 的 影响 . 先 看 一 个 例子 : 线性 方 


程 组 
| 上 = |, (30) 


的 解 是 x 二 (2, 0)" , 若 右 端 项 稍 有 变化 


1 1 [| 必 
es a 
1 .1.001JLz; 2.001 


则 解 变 为 x 二 (1, 1)", 右 端 项 5 的 微小 变化 引起 解 x 的 很 大 变化 , 真 乃 “ 差 之 毫 厘 , 失 之 千 
里 ”, 可 以 说 x 对 5 的 扰动 是 敏感 的 . 分 析 其 原因 是 ,系数 矩阵 4 的 两 个 行 向 量 近 于 线性 
相关 ,对 应 于 图 5. 1 中 的 两 条 直线 Mi Ni 和 Ms NN; 近 于 平行 , 当 。 的 微小 变化 引起 M; Ja 
的 微小 平移 (图 5. 1 中 虚线 ) 时 ,两 条 直线 的 交点 ( 即 线 
性 方程 组 的 解 ) 改 变 很 大 . 

一 般 地 , 若 线 性 方程 组 系数 矩阵 或 右 端 项 的 微小 拢 
动 (或 称 摄 动 ;引起 解 的 很 大 变化 ,就 称 为 病态 线性 方程 
组 ,系数 矩阵 称 为 病态 矩阵 . 反之 , 称 为 良 态 线性 方程 组 
和 良 态 矩阵 . 

从 上 面 的 例子 可 以 想到 , 近 于 奇异 的 矩阵 大 概 是 病 
态 的 .为 了 衡量 矩阵 的 “性 态 ”, 首 先 要 有 度量 矩阵 “大 
小 ”的 指标 ,而 这 种 指标 与 度量 向 量 大 小 的 指标 有 密切 图 5.1 方程 组 (30} 和 (31) 的 图 示 

(2) 向 量 范 数 和 矩阵 范 数 

对 于 nn 维 空间 向 量 x 二 (zi ,zx2,… ,Xz,) ,习惯 上 用 的 向 量 模 称 为 向 量 的 2- 范 数 , 记 作 


xl = (站 (32) 


一 般 地 定义 p~ 范 数 为 
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lx 一 (> |z1*) *, p21, (33) 
i=1 

其 中 常用 的 除 2- 范 数 外 ,还 有 p= 二 1 时 的 1- 范 数 
zl = 2) |z |， (34) 

i=1 

和 2 一 ce 时 的 co- 范 数 

| xll。 一 max|>z |. (35) 

l<i<n 


和 矩阵 4 二 (az ),xs 的 1 - 范 数 (又 称 列 范 数 )、co- 范 数 ( 又 称 行 范 数 ) 和 2- 范 数 分 别 定 
义 为 


|All, = max2 | |， (36) 
| 41。 = max 2) | ay | ， (37) 
1 Al: = Vn (A TA), 、 (38) 
其 中 4w。.《47A) 表 示 47I4 的 最 大 特征 根 . 它们 与 向 量 范 数 之 间 满 足 
| Axl,< 1Al,. lxl|,, p=1,2,.,00, (39) 
称 为 矩阵 范 数 与 向 量 范 数 的 相 容 性 条 件 . 


(3) 和 矩阵 条 件数 
下 面 讨论 线性 方程 组 4x 二 5 右 端 b 的 扰动 引起 x 的 扰动 6x. 设 4 不 变 ,于 是 有 
A(x 十 6x) 二 bp 十 6b, 即 A5x 二 6b ,可 得 


5x = A-1'6b. (40) 
由 (39) 式 ( 略 去 下 标 p), 有 
lex| |All .lpl. (41) 
另 一 方面 ,由 Ax 一 b 和 (39) 式 有 上 5| 志 上 41| 中 xl ;, 即 | 
Ixl 宇 5l/H41. (42) 
联合 (41) 式 (42) 式 就 得 到 | 
I a a (43) 
可 见 ,x 对 5 扰动 的 敏感 程度 取决 于 4-1 。 141 .定义 
cond(4)= | 4 |、 1 41 ， (44) 
称 为 4 的 条 件数 , 则 
Lox 二 cond(4)。 1 52 | ， (45) 
| xl 上 2 


即 条 件数 可 作为 误差 的 上 界 . 


5.3 求解 线性 代数 方程 组 的 迭代 法 


考虑 4 的 扰动 64 引起 x 的 扰动 6x ( 设 5 不 变 ), 即 有 (4 十 64) (x 十 6Y)= 二 6b, 类 似 地 可 


推导 出 , 当 | 64 | 足够 小 ,使 得 | 4"! .84 上 <<1 时 ,有 
外 sx | cond(4) ,由 54 | 
[el dc 4 
A 


由 (45) 式 ,(46) 式 可 知 , 解 二 对 右 端 项 上 和 系数 矩阵 4 扰动 的 敏感 程度 取决 于 4 的 


条 件数 .4 的 条 件数 越 大 , 解 的 相对 误差 就 可 能 越 大 ,所 以 条 件数 反映 了 线性 方程 组 的 性 

态 . 车 4 的 条 件数 相对 地 大 , 即 cond(4) 污 1, 则 线性 方程 组 Ax= 二 b 是 病态 的 ,cond(4) 越 

大 ,病态 越 严重 , 越 难 获得 比较 准确 的 解 .反之 , 若 4 的 条 件数 相对 的 小 ， 则 方程 是 良 
(4) 希 尔 伯 特 (CHilbert) 矩 阵 


n 阶 希 尔 伯 特 扼 阵 定义 为 
1 和 1/n 
ee 1 a WD ee 
. by Cm 


当 n 较 大 时 五 呈 严 重病 态 , 常 作为 研究 病态 现象 的 系数 矩阵 . 如 5 阶 希 尔 伯 特 矩阵 


的 1- 条 件数 cond( 五 );s*9.4X105 ,2- 条 件数 cond(H), 半 4.8X105 ,对 于 线性 方程 组 Hx 二 b， 
x 的 (相对 ) 误 差 可 以 达到 多 或 吾 ) 的 (相对 ?误差 的 10 倍 以 上 . 


s.3， 求 解 线性 代数 方程 组 的 和 迭代; 


直接 法 一 般 适 用 于 中 、 小 型 的 线性 方程 组 (如 ”<10') ,而 在 科学 计算 和 工程 技术 中 
常会 过 到 具有 大 型 稀 玖 矩阵 ( 指 很 大 目 零 元 素 较 多 ) 的 方程 组 ,这 时 从 计算 和 存储 两 方 
面 来 说 ,迭代 法 都 是 一 种 更 合适 的 选择 . 


$5.3.1 雅 可 比 迭代 和 高 斯 - 赛 德 尔 迭 代 
先 看 如 下 的 数字 例子 : 


9zx1 一 Za 一 23 一 7， 
4 一 十 10z 一 Xi 二 8， (48) 
国 1 一 Zz 十 157zs 一 13. 
线性 方程 组 (48) 可 等 价 地 写 为 
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zi 一斑 忆 十 二 ms 十 芝 ， 
一 站 雪 十 贡 司 十 辣 ， (49) 
一 车 二 十 在 二 十 卫 
利用 线性 方程 组 (49) 可 以 进行 如 下 形式 的 迭代 (用 上 标 (k) 表 示 和 迭代 步 数 ): 
ze 一 语 z 吕 十 言 z 名 十 本， 
zr? 一 在 z 史 十 贡 z 十 攻 (50) 
有 1 本 1 和 
对 选 定 的 初始 解 x 一 (zi ,xz 约 ,x2)" ,可 由 (50) 式 迄 代 计算  ，x 2 ，… 如 取 x 人 二 


(0,0,0)T ,计算 至 有 二 3 时 可 得 x 一 (0.9987,0.9988,0. 9991)7， 忆 双 与 线性 方程 组 (48) 
的 精确 解 x 二 (1,1,1)” 非常 接近 . 这 就 是 求解 线性 方程 组 的 雅 可 比 迭 代 法 . 
从 (50) 式 的 迭代 过 程 很 容易 发 现 ,计算 z 拓 >” 时 zx 已 经 知道 ,计算 x+5 时 


zn 和 zt? 均 已 知道 . 因此 ,如 果 在 计算 zy*? 和 地 fo 时 ,用 最 新 的 值 zero 和 
X22 进 行 迁 代 ， 则 可 得 如 下 的 公式 : 
zn 一 末 z 史 十 了 -名 十 可 
zDD 一 坟 7 zDD 十 贡 We (51) 
tttD 一 于 zt 十 于 zx SetD 二 下. 


称 为 高 斯 - 赛 德 尔 和 迭代 法 . 
对 方程 组 (48) 用 以 上 两 种 迭代 公式 计算 的 结果 如 表 5. 3 所 示 , 可 以 发 现 高 斯 - 赛 德尔 
壕 代 法 比 雅 可 比 迭 代 法 收敛 要 快 . 


表 5.3 ”对 方程 组 (48) 雅 可 比 法 和 高 斯 - 赛 德尔 法 的 计算 结果 


k x"( 雅 可 比 法 ) x (高 斯 - 赛 德尔 法 ) 
| 0 (0,0,0) (0,0,0) 
| 1 i (0. 7778， 0. 8000, 0. 8667) (0.7778, 0.8778, 0. 9770) 
2 (0.9630, 0.9644, 0.9719) (0.9839, 0.9961, 0. 9987) 
3 (0.9929, 0.9935, 0. 9952) (0.9994, 0. 9998, 0. 9999) 
4 (0.9987, 0.9988, 0.9991) (1.0000. 1.0000, 1. 0000) 


5.3 求解 线性 代数 方程 组 的 欠 代 法 


对 于 一 般 的 线性 方程 组 4Ax=D ,假设 a; 关 0(i 王 1,2,…,n), 雅 可 比 迭代 公式 是 


zt = Laz Oar CO) 
QI11 
et | 2 zi 一 Qz3 工 的 ES aznT 十 02) ?9 
-< Q22 
zl 一 了 工 (一 az 一 az 多 一 人 一 aoiz 多 十 加) 
Qn 
如 果 将 4 分 解 为 
A4=D—L—U,， 
Qll 0 0 ] 0 0 Q12 
0 G22 ; Q2] 0 0 
D 9 L ee 风 9 U es 
0 : 
0 … 0 am an ar 0 
则 迁 代 公式 (52) 等 价 于 如 下 的 矩阵 形式 


Xe 一 DT 十 U)xeO 十 DB5， 类 一 0,1;2，… 
或 
xD =Bx®+f, B=D'L+tU), f=D'b. 
(54) 式 ,(55) 式 为 雅 可 比 迭 代 , Bj 是 迭代 矩阵. 
类 似 地 ,4x 二 4b 的 高 斯 - 赛 德尔 迭代 公式 是 ( 仍 设 a; 了 0(i 二 1,2,…,n)) 


1 
TD = ar ar C—O a 二 D1), 
Cil 
1 
TD 一 一 (一 aa axl C—O qt 十 加 )， 
Q22 
1 
4 一 一 (一 QZ 一 0 和 C—O 二 6,). 
Qn 
ear: 二 
等 价 于 如 下 的 矩阵 形式 


x'HD jm 也 (Ex (人 十 Ux*) 十 Dib， k 二 0,1,2,.…. 
经 整理 有 


Xi 一 Besx'® 十 fos， Be.s = (D— LL) iU, fc.s = (D 一 工 ) 一 0 


(57) 式 ,(58) 式 为 高 斯 - 赛 德 尔 迭 代 ,Bes 是 迄 代 矩 阵 . 


(52) 


Ql 


(56) 


(57) 


(58) 


雅 可 比 迭 代 公式 简单 ,特别 适合 并 行 计算 ;高 斯 - 赛 德尔 适 代 计算 出 的 zx， ”可 立即 
存 入 xz 多 的 位 置 ,只 需 一 个 向 量 存储 单元 ,是 典型 的 串 行 计算 ,一 般 情况 下 收敛 会 快 些 . 
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5.3.2 和 迭 代 法 的 收 人 鱼 性 和 收敛 速度 


用 迭代 法 计算 都 会 遇 到 是 否 收 敛 及 收敛 速度 的 问题 .上 面 用 两 种 迭代 法 求解 线性 方 
程 组 4x 二 b 时 , 先 将 它 表 为 等 价 形式 


x= Bx 十 让 ， (59) 
号 到 和 迭代 形式 . 
xD = 一 Bx” 十 了 ， k=0,1,2,. (60) 
设 x’ 是 原 线性 方程 组 的 解 , 即 
x =Br'+f. (61) 
(60) 式 与 (61) 式 相 减 后 再 由 二 0 递 推 可 得 : 
x 一 YX = B(x —x"). (62) 


由 此 可 知 ,&k 一 oo 时 序列 (x) 收敛 于 x* 等 价 于 B* 趋 于 0, 而 B* 趋 于 0 等 价 于 8B 的 所 有 
特征 根 ( 取 模 ) 小 于 1. 这 时 称 迭 代 公 式 ( 或 迭代 法 ) 收 敛 ， 

记 ? 阶 和 矩阵 中 的 特征 根 为 4;, 称 

2(B) = max [2ai | (63) 

. 为 B 的 谱 半 径 . 由 上 述 分 析 可 得 

迭代 公式 (60) 收 敛 的 充 要 条 件 是 B 的 谱 半 径 p(B)<<1. 

可 以 证 明 , 和 矩阵 的 谱 半 径 不 超过 它 的 ( 任 一 种 ) 范 数 , 即 o(CB) 科 | 互 | 上, 所 以 若 
| 吾 | 王 ee 扫 1, 则 和 迭代 公式 (60) 收 和 敛 , 且 有 误差 估 计 式 


| XD x* 中 过 | XD x | (64) 


1 


xt Dx | 声 alx (1) 0 |. (65) 


可 以 看 出 ,9 越 小 序列 {x”} 收 敛 越 快 . ee 只 要 q 不 太 接 近 于 1, 当 相 邻 两 次 
和 迭代 结果 x**? ,x 相近 时 ,x**， 就 与 精确 解 x* 很 接近 . 因此 在 实际 计算 中 ,可 以 用 
| xz 一 < | 和 se 作为 迭代 终止 的 条 件 . 

实际 上 ,上 面 给 出 的 收敛 条 件 oC(B)<1, | 如 | 三 9<1 只 有 在 得 到 迭代 矩阵 B 以 后 才 
能 检验 ,我 们 更 需要 直接 根据 系数 矩阵 4 的 性 质 来 判别 迭代 法 的 收敛 性 . 两 个 常用 的 结 
果 如 下 : 

若 4 是 严格 对 角 占 优 的 , 即 | ar |> 2 | az | (二 1,…,n), 则 雅 可 比 迄 代 和 高 斯 - 


赛 德 尔 和 迭代 均 收 敛 . 
若 4 对 称 正 定 , 则 高 斯 - 赛 德尔 迭代 法 收敛 . 


s.3.3 超 松弛 选 代 
超 松弛 (〈successive over relaxation,SOR) 和 迭代 法 是 对 高 斯 - 赛 德 尔 迭 代 的 一 种 改进 . 


5.4 超 定 线性 代数 方程 组 的 最 小 二 来 解 


首先 用 高 斯 - 赛 德尔 迭代 的 (57) 式 左 端的 ze 7 作为 中 间 结果 x**，, 即 


xD 一 D-IOLzetD Ux®) + D-'b. (66) 
再 取 xX%+ 和 x 的 加 权 平 均 作为 最 终结 果 x**? , 即 
XD = TAD 二 (wx, (67) 


其 中 w 为 加 权 因 子 ,w>1 时 称 为 超 松 弛 迭代 ,w 过 1 时 称 为 低 松弛 迁 代 ,w=1 时 退化 为 高 
斯 - 赛 德 尔 迭 代 ， . 
为 分 析 其 收敛 性 , 需 将 (66) 式 ,(67) 式 写成 如 下 标准 迭代 公式 : 
x = Bx® +f,, B= (Dv) + (mw)D], f= wD—wL)!b. 
(68) 
和 迭代 公式 (68) 收 和 敛 的 充 要 条 件 是 谱 半径 p(B.)<1. 这 个 结果 并 不 好 用 ,一 个 特殊 情况 
如 下 : 
车 4 对 称 正定 , 则 迭代 公式 (68) 收 敛 的 充 要 条 件 是 0 二 w=<2. 
SOR 和 迭代 法 可 以 看 做 是 带 参数 的 高 斯 - 赛 德尔 迭代 法 ,是 解 大 型 稀疏 矩阵 方程 组 的 
有 效 方法 之 一 . 


s.4 超 定 线性 代数 方程 组 的 最 小 二 乘 解 


5.1.3 节 中 为 了 由 车 速 与 刹车 距离 的 实际 数据 确定 模型 的 系数 ,得 到 线性 方程 
(10) , 它 的 方程 个 数 超 过 了 未 知 数 个 数 , 称 为 超 定 线性 方程 组 . 3 组 
”在 普通 意义 下 是 无 解 的 ,只 能 在 新 设 定 的 准则 下 定义 它 的 解 . 求解 超 定 线性 方程 组 的 一 个 
重要 实际 背景 就 是 像 5. 1. 3 节 那 样 的 数据 拟 合 ,让 我 们 就 由 此 来 讨论 超 定 线性 方程 组 的 


5.4.1 最 小 二 乘 准则 


数据 拟 合 问题 的 提 法 是 ,已 知 一 组 数据 zy (一 1,2,…,7z)， 寻 求 一 个 函数 > 一 
f(z) ,使 将 xz; 代入 得 到 的 f(zi) 在 某 种 准则 下 与 y; 最 为 接近 (i 二 1,2,…,n). 

数据 拟 合 在 几何 上 可 以 看 作 是 找 一 条 曲线 y 王 了 (zx) ,与 平面 上 已 知 的 个 点 (xi, yi) 
在 某 种 准则 下 最 为 接近 , 称 为 曲线 拟 合 ,如 图 
5. 2. 

与 插值 不 同 的 是 ,做 拟 合 时 函数 y= 二 f(x) 的 形 
式 ,或 者 如 5.1.3 节 那 样 已 经 在 实际 问题 的 建 模 过 
程 中 确定 ,或 者 可 以 根据 数据 的 变化 趋势 靠 经 验 给 。 
出 . 最 简单 .常用 的 如 线性 肾 数 y 一 及 十 Piz, 二 次 国 图 5.2 曲线 拟 合 示意 图 
数 y= 二 Bo 十 Bz 十 Bx 等. (XX 是 数据 点 ,6; 为 (zxi,%) 与 y= 7z) 的 距离 ) 
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一 般 地 ,假定 拟 合 函数 y=/(z) 具 有 如 下 形式 
| ey es Bod pda Es 
其 中 mr(z) ,pz)，…goo(z) 是 事先 选 定 的 一 组 函数 , 称 为 基 函 数 ,& ,PB ，,… ,pb 是 待定 系 
数 ,而 且 待 定 系数 个 数 mz 十 1 79 小 于 数据 容量 n 
形式 地 看 ,如 果 强 令 f(z;) 二 y;(i 二 1,2,: re 


(70) 


| 十 Bgi(zi) 十 十 Bpn(T1) 二 yi， 
Brgo Ts) Tt Bigilz,) te 二 Bp Ti) = yn 
记 
PolT1) OICT1) 1 pn (TI) | 
$= : ， B= (880pB y= (ys ys) 
go (Tn) pi CX) 2 Pm Tn ) nX Cnmt1) | 
(71) 
则 方程 (70) 可 写作 
DP = y. (72) 


因为 x 之 mx 十 1, 所 以 (70) 式 或 (72) 式 是 超 定 线性 方程 组 ,在 一 般 意义 下 无 解 . 

数据 拟 合 不 要 求 fz;i)=y(i=1,2, ,7) ,而 是 确定 一 个 f(z;) 与 yi 最 为 接近 的 准 
则 . 最 常用 的 准则 是 使 f(zi) 与 y:(i 一 1,2,…,n) 之 差 的 平方 和 ( 即 图 5.2 中 $ 的 平方 和 ) 
最 小 , 称 为 最 小 二 乘 准则 . 1 
5.4.2 最 小 二 乘 解 
记 

J (Bo ,PB1 gn ,Bn ) 3 2 [fCz) — yj 五: 2 [2 pp (Zi) —y:|: (73) 

按照 最 小 二 乘 准 则 ,& ,PB，… ,Pp 应 使 J 达到 最 小 . 利用 多 元 西数 极 人 的 必要 信件 2]/28 0 
(二 0,1,…,m) ,得 到 关于 BB, ,Bi，* 0 的 线性 方程 组 


Sl —y; |= 0， 
2 = 


2 pu xi) | DD pos Cxi) 3 y; |= 0. 
在 (71) 式 的 记号 下 方程 组 (74) 可 表 为 


5.4 超 定 线性 代数 方程 组 的 最 小 二 乘 解 


DDP = Dy, (75) 
(75) 式 称 为 正规 方程 (或 法 方程 ) , 当 gv (x) ,pi (x),… ,gw(z) 线 性 无 关 时 ,B 列 满 秩 ,@7@ 
可 逆 , 方 程 组 (75) 有 惟一 解 
B= (BD) Dy. (76) 
能 够 进一步 证 明 , 由 极 值 必 要 条 件 得 到 的 及 就 是 (73) 式 J(p) 的 最 小 解 . 
正规 方程 (75) 的 解 (76) 式 称 为 超 定 方程 组 (72) 的 最 小 二 乘 解 . 可 以 看 出 ,由 于 (69) 式 
中 f(x) 关于 待定 系数 & ,8 ,…,B, 线性 ,在 最 小 二 乘 准则 (73) 下 得 到 的 (75) 式 关于 记 ， 
B，…,B, 也 一 定 是 线性 的 , 故 称 线性 最 小 二 乘法 . 
5.4.3 基 函 数 的 选取 
面 对 一 组 数据 (zx;, yi) (i 二 1,2,…,n) 用 线性 最 小 二 乘法 做 拟 合 时 ,首要 的 ,也 是 关键 
的 一 步 是 恰当 地 选取 go (Xx) ,pr (x),… ,g(x). 如 果 通 过 机 理 分 析 , 能 够 建立 数学 模型 确 
定 y 与 xz 之 间 的 函数 关系 , 则 mw(z),p (xz)，,… ,p(x) 容 易 知道 ;否则 可 以 将 数据 (zx;,y;) 


(i 二 1,2,…,n) 作 图 ,直观 地 判断 大 概要 用 什么 样 的 曲线 做 拟 合 . 人 们 常用 的 曲线 有 (参见 
图 5. 3) a 


。 直线 y=B TBzr 

。2, 3 次 曲线 y 二 忆 十 Biz 十 … 十 Baz”( 一 般 mr 二 2,3, 不 宜 太 高 ) 
。 双 曲 线 ( 一 支 ) 2 一 所 十 Br 

。 指数 曲线 y=P en 


对 于 指数 曲线 , 拟 合 前 需 作 变量 代 换 ,化 为 对 待定 系数 的 线性 函数 ， 
已 知 一 组 数据 ,用 什么 样 的 曲线 拟 合 最 好 ,可 以 在 直观 判断 的 基础 上 , 选 几 种 曲线 分 
别 作 拟 合 ,然后 比较 ,看 哪 条 曲线 的 最 小 二 乘 指标 Jp) 最 小 . 


y > 2 2 
{pirp ee 


二 BotBixthor? 
(B=< 0) 


O Xx 
中 J 天 BoebxpB > 0) 中 Jpoepr(p < 0) 
A + 
4 tN 
OO oO ~ 


图 5.3 常用 的 拟 合 曲线 
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5.5 线性 方程 组 数值 解法 的 MATLAB 实现 
5.5.1 相关 的 MATLAB 命令 


(1) 求解 方程 组 Ax 二 b 

输入 4,b 后 用 左 除 命令 :x 二 A\b. 若 4 为 可 首 方 阵 , 输 出 原 方程 的 解 x; 若 和 4 为 xn Xm 
”和 撼 阵 (xz>m), 且 4 4 可 道 ,输出 原 方程 的 最 小 二 乘 解 x. 

(2) 矩阵 LU 分 解 

[x,yj=Iu(A) 输出 x 为 一 交换 矩阵 与 单位 下 三 角 短 阵 之 积 ,y 为 上 三 角 和 矩 阵 ; 

[x,y,pj=Ilu(A〉 输出 x 为 单位 下 三 角 和 矩阵 ,y 为 上 三 角 和 矩阵 ， | 使 

pA=xy; 

u =chol(A) 对 正定 对 称 和 矩阵 A 的 Cholesky 分 解 ,输出 u 为 上 三 角 和 矩阵 ,使 A=u'u. 

(3) 和 矩阵 的 范 数 、 条 件数 、 秩 、 特 征 值 

n= norm(x,1) 输入 x 为 向 量 或 矩阵 ,输出 为 x 的 1- 范 数 . 

n=normCx) 输入 x 为 向 量 或 矩阵 ,输出 为 x 的 2- 范 数 . 

n=norm(x, ini) 输入 Xx 为 向 量 或 矩阵 ,输出 为 x 的 %- 范 数 . 

c= cond(x, 1) 输入 x 为 矩阵 ,输出 x 的 1- 条 件数 . 


c= cond(x) 输入 x 为 矩阵 ,输出 x 的 2- 条 件数 . 

c= cond(x,inf) 输入 x 为 矩阵 ,输出 x 的 %- 条 件数 . 
r=rcond(x) 输入 x 为 向 量 , 输出 x 的 条 件数 倒数 的 估计 值 . 
r=rank(x) 输入 x 为 向 量 , 输出 x 的 秩 . 

e=eig(x) 输入 x 为 矩阵 ,输出 x 的 全 部 特征 值 . 


[V,D] = eig (x) ”输入 x 为 矩阵 ,输出 DD 是 特征 值 组 成 的 对 角 和 矩 阵 ,V 是 特征 向 量 
为 列 组 成 的 矩阵 ,使 xV = VD， 

(4) 提取 (产生 ?对 角 阵 

v= diag(x) 若 输入 向 量 x, 则 输出 v 是 以 x 为 对 角 元 素 的 对 角 和 矩阵 ; 
若 输入 矩阵 x, 则 输出 v 是 x 的 对 角 元 素 构成 的 向 量 ， 

v=diag(diag(x)) 输入 矩阵 x, 输 出 v 是 x 的 对 角 元 素 构成 的 对 角 扼 阵 , 可 用 于 选 
代 法 中 从 A 中 提取 D. 

(5) 提取 (产生 ) 上 (下 ) 三 角 矩 阵 


v= triu(x) 输入 矩阵 x, 输 出 v 是 x 的 上 三 角 和 矩阵 . 
v=tril(x) 输入 矩阵 x, 输 出 v 是 x 的 下 三 角 矩 阵 . 
v=triu(x,1) 输入 矩阵 x, 输 出 v 是 x 的 上 三 角 和 矩阵 ,但 对 角 元 素 为 0, 可 用 于 


迭代 法 中 从 A 中 提取 U， 


5.5 线性 方程 组 数值 解法 的 MATLAB 实现 


v=tril(x, ~ 1) 输入 和 矩阵 x, 输 出 v 是 x 的 下 三 角 和 矩阵 ,但 对 角 元 素 为 0, 可 用 于 


迭代 法 中 从 A 中 提取 上， 
(6) 特殊 矩阵 
h=hilb(n) 输出 是 n 阶 希 尔 伯 特 矩阵 (由 (47) 式 定义 ),n 较 大 时 呈 严 重病 态 . 
p=pascalin) 输出 是 n 阶 Pascal 矩阵 , 对 称 正定 ,请 读者 观察 其 特点 . 
(7) 稀 朴 矩阵 


对 稀 朴 矩阵 的 存储 和 运算 做 特殊 处 理 , 是 MATLAB 进行 大 规模 科学 计算 时 的 特点 
和 优势 之 一 .用 以 下 语句 输入 稀疏 矩阵 的 非 零 元 素 ( 零 元 素 不 必 输 入 ) , 即 可 进行 运算 . 
S=sparse(i,j,s,m,n) 表示 在 第 i 行 .第 j 列 输入 数值 s, 矩 阵 共 mm 行 n 列 ,输出 S 
为 一 稀 蚊 矩阵 ,给 出 〈ij) 及 s， 


SS=full(S) 输入 稀疏 和 矩阵 S, 输 出 SS 为 满 矩 阵 ( 包 含 零 元 素 ) . 
如 
S= sparse(2,3,1,2,4),SS=full(S) 
得 到 
S = (2,3) 1 
ss=0 0 0 0 
0 0 1 0 
i,j,s 也 可 用 数组 形式 输入 ,如 
i=[1,2];j=[2,3];s=[1,2];S= sparse(i,j,s,3,4),SS= full(S) 
得 到 
S =(1,2) 1 
(2,3) 2 


SS =0 1 0 0 


用 下 面 的 例子 说 明 稀 下 和 矩阵 计算 的 优点 : 


设 
4 1 
or : 
2 
4 一 | 1 4 ， b= | .|， 
让 1 各 
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用 稀 朴 矩阵 和 满 矩 阵 分 别 求解 4x 二 b, 对 计算 时 间 进 行 比较 . 
设 2 王 1000,2000,… ,编制 以 下 程序 计算 : 


n= 1000,， 

A1= sparse(1:n,1:n,4,n,n); % 输入 A 的 对 角 元 素 
A2=sparse(1:n 一 1,2:n,1,n,n);  % 输入 A 的 (上 ) 次 对 角 元 素 

A=Al+ A2+ A2';  ”  % 输入 A 的 对 角 元 崇 

b=[1:n]'; | 

tic; x= A\b; t1= toc % 输出 用 稀 朴 矩阵 求解 的 时 间 t1 

AA= full(A); % 与 满 矩阵 作 比 较 

tic; xx= AA\b; 这 =toc . % 输出 用 满 矩 阵 求解 的 时 间 这 

y= sum(x) % 为 检验 x 与 x x 相同 分 别 输 出 其 分 量 之 和 


yy= sum(xx) 
结果 y 与 yy 相同 ,而 tl 与 世相 差 巨大 . 
下 面 继续 讨论 5.1 提出 的 3 个 实例 . 
5.5.2 投入 产 出 分 析 ( 续 ) 


(1) 如 果 今 年 对 农业 、 制 造 业 和 服务 业 的 外 部 需求 分 别 为 50 亿 元 ，150 亿 元 , 100 亿 
元 , 求 这 三 个 部 门 的 总 产 出 . 

编制 以 下 程序 解 方 程 组 (5): 

a=[0.15 0.10.2;0.3 0.05 0.3;0.2 0.3 0]; % 按 表 5.2 输入 投入 系数 矩阵 A 


a Coo 50 % 输入 外 部 需求 d 

b 王 eye(3) 一 ai % 1 一 A 

x=b\d % 解 线性 方程 组 (5) 
得 到 


x= 139.2801 267.6056 208.1377 


即 三 个 部 门 的 总 产 出 分 别 应 为 139. 2801,267. 6056，208. 1377( 亿 元 ). 

(2) 如 果 三 个 部 门 的 外 部 需求 分 别 增加 1 个 单位 , 问 它们 的 总 产 出 应 分 别 增加 多 少 . 

从 线性 方程 组 (5) 可 得 

x= (1—A) id. (77) 

表明 总 产 出 x 对 外 部 需求 4 是 线性 的 ,所 以 当 4 增加 1 个 单位 ( 记 作 Ad) 时 ,x 的 增 量 为 
Ax 二 (1 一 4)~!Ad. 车 农业 的 外 部 需求 增加 1 个 单位 ,Ad 二 (1,0,0)7 ,Ax 为 (1 一 4)-! 的 第 
1 列 ; 制 造 业 和 服务 业 的 外 部 需求 增加 1 个 单位 ,Ax 为 (1 一 4) 的 第 2,3 列 .于 是 接 上 面 
程序 用 矩阵 求 送 命 令 计算 


dx= inv(b) 


得 到 


5.5 线性 方程 组 数值 解法 的 MATILAB 实现 


dx= 1.3459 0.2504 0.3443 
0.5634 1.2676 0.4930 
0.4382 0.4304 1.2167 


可 知 当 农业 的 需求 增加 1 个 单位 时 ,农业 、 制 造 业 和 服务 业 的 总 产 出 应 分 别 增加 1. 3459， 
0.5634,0. 4382 单位 . 其 余 类 似 . 这 些 数 字 称 部 门 关 联系 数 . 

(3) 讨论 为 使 投入 产 出 分 析 是 可 行 的 (对 任意 、 非 负 的 外 部 需求 都 能 得 到 非 负 的 总 产 
出 ), 投 入 系数 应 满足 什么 条 件 . 

要 使 对 任意 的 需求 d 实 0, 由 (77) 式 能 够 得 到 总 产 出 x 之 0, 显 然 只 需 (1 一 4) 1 之 0( 指 
每 个 元 素 非 负 , 下 同 ). 

因为 (I 一 A) (CA 十 4 十 … 十 和) 二 [一 A411, 目 A 守 0, 所 以 只 要 A* 一 0(k-> co)， 


就 有 (一 4) 一 214' 这 0. 而 由 矩阵 范 数 的 性 质 可 知 4* 一 0 与 4* 一 0 等 价 , 且 

i141 < 41, 故 只 要 4 上 过 1( 这 里 取 便 于 应 用 的 1- 范 数 ), 即 

| Sar ai 7 二 1,2," ,ns (78) 
i 一 ] 


投入 产 出 分 析 就 是 可 行 的 . 
如 果 投 人 系数 4 是 根据 实际 数据 算出 的 (如 由 表 5. 1 得 到 表 5. 2), 由 (2) 式 可 知 (78) 式 
等 价 于 
DD j = 1,2,° un. (79) 
由 表 5. 1 可 知 ,只 要 初始 投入 非 负 ,《79) 式 自然 成 立 , 因 而 投入 产 出 分 析 可 行 . 


5.5.3 一 年 生 植物 的 繁殖 ( 续 ) 

设 c 二 10, al 王 0.5,as 二 0.25,6 二 0.20, 开 始 有 100 棵 植物 ,要求 50 年 后 有 1000 棵 植 
物 , 则 方程 组 (7),(8) 中 2 一 一 aipc 王 一 1,9 一 一 az0(1 一 ai) pc 一 一 0.05，72 一 50,zo 一 100， 
Zso 二 1000, 用 以 下 两 种 方法 求解 方程 组 (7), (8). 

Q@ 用 MATLAB 对 稀 朴 矩阵 的 特殊 处 理 , 编 程 如 下 : 


p= 一 1;q= ~0.05;x0= 100;xn= 1000; n= 49; 


Al= sparse(1 : n,1 : np,nyn); % 输入 A 的 对 角 元 素 
A2= sparse(1 : n—1,2:n,1,n,n); % 输入 A 的 (上 ) 次 对 角 元 烷 
A3= sparse(2 : n,1 : n— 1,q,n,n); % 输入 A 的 (于 ) 次 对 角 元 崇 . 


A=AlT A2+ A3; 
i=[1,n];j=[1,1];s=[—qxx0,—xnj; 


b= sparse(i,j,s,n, 1); % 输入 b 
x=A\b; % 用 稀 玻 矩阵 求解 
x1=x(1),， % 输出 第 2 年 植物 数量 x1 


k=0 : n+1;xx 一 [x0,xoxn]i; 
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plotCk, xx) , grid 
得 到 
x1 = 101.7097 


Zz 的 图 形 如 图 5. 4. 


1000 


Xk 


图 5.4 一 年 生 植物 繁殖 x 的 图 形 


若 取 第 2 年 植物 102 棵 ,按照 (6) 式 计算 ,zso 与 1000 稍 有 出 人 . 
@ 用 求解 三 对 角形 方程 组 (27) 一 (29) 的 追赶 法 ,编程 如 下 : 


p=~1;q= 一 0.05;x0= 100;xn= 1000; n= 49; 


1=zeros(n,1);1(1)= ~ qx x0;f(n) = —xn; % 输入 方程 右 端 项 
u(1)=p;y(1)=H1); % 输入 1, u 初 值 
tor i=2:n % 递 推 计算 方程 组 (28) ,(29) 的 fuy， yi 
LCD=q/uGi 一 1); 
uj) =p— 上 C0); 
yGD=fD 一 LOD xy 一 1); 
end 


X= zeros(1,n); 

xCn) =yCn) /uln); 

for i=n—1: —1:1: % 递 推 计算 (29) 式 中 的 x 
xOD= (yO x(it+1) /uD; 

end | 

x 


得 到 的 结果 相同 . 
5.5.4 汽车 刹车 距离 ( 续 ) 


已 经 通过 机 理 分 析 建 立 了 刹车 距离 4 与 车 速 v 的 模型 :d= 二 kv 十 kv ,需要 对 一 组 实 
际 数据 (vw,， di) (i 二 1,2,…,n) 在 最 小 二 乘 准 则 下 做 数据 拟 合 ,计算 出 kl 》 k2. 
与 拟 合 函数 (69) 式 比较 , 取 pi 二 v,9 二 九 , 对 照 (71) 式 构造 


5.6 实验 练习 


Vl Ul 
五 一 | | ， B= (kk), y= (di,,d,)'. 
nxX2 


2 
Un Un 


求解 超 定 方程 组 (72) ， 名 8 一 小. 对 表 1.1 给 出 的 数据 (vw;， di)( i 二 1,2,… ,7) 编 程 如 下 : 


得 到 


v= [£20 : 20 : 140]/3.6; 

V2= Vv.°2; 

x=[v;v21'; 
d=[6.5,17.8,33.6,57.1,83.4,118.0,153.51'; 
a=x\d 

dd 二 x*a 


a 一 0.6522 0.0853 


依次 为 &1 ,kk. 
dd( 见 表 1.2) 


% 输入 vi( 单 位 由 km/h 化 为 m/s) 


% 构造 中 

% 输入 d 

% 左 除 ,输出 最 小 二 乘 解 
% 计算 刹车 距离 ,与 d 比较 


如 果 不 管 机 理 分 析 的 结果 ,只 从 数据 作 图 的 直观 出 发 (参看 图 1. 2) ,可 以 拟 合 如 下 模 
型 :d 二 如 十 Riv 十 姑 v, 即 完全 二 次 多 项 式 . MATLAB 有 专门 用 于 完全 多 项 式 拟 合 的 命令 ; 


a = polyfit(x,y,m) 


其 中 输入 zx,y 是 要 拟 合 的 数据 数组 (长 度 相 同 ),m 为 拟 合 多 项 式 的 次 数 , 输 出 a 为 拟 合 
多 项 式 y 王 ayz" 十 … 十 anX 十 am+t1 的 系数 4a 二 [上 al,… ,a ;amt1j( 降 客 排 列 ). 
下 面 的 命令 常 与 polyfit 连用 ,计算 上 述 多 项 式 在 xz 处 的 值 y: 


得 到 


y= polyval(a.x) 


对 于 本 例 编程 如 下 : 


v=[20.20.140]/3.6; 
d=[6.5,17.8,33.6,57.1,83.4,118.0,153.5]; 
b= polyfit(v,d,2) 

y= polyval(b,v) 


b= 0.0851 0.6617 0.1000 
依次 对 应 ks 到 1 ,ko. 
y( 上 略 ) 


5.6 实验 练习 


实验 具 的 


1,， 学 会 用 MATLAB 软件 数值 求解 线性 代数 方程 组 ,对 迭代 法 的 收敛 性 和 解 的 稳定 


US 
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性 作 初步 分 析 ; 
2， 通 过 实例 学 习 用 线性 代数 方程 组 解决 简化 的 实际 问题 . 
实验 内 容 


1. 通过 求解 线性 方程 组 hx 一遍 和 4:x 一 肪 ,理解 条 件数 的 意义 和 方程 组 的 性 态 对 
解 的 影响 .其 中 4, 是 ” 阶 范 德 蒙 矩 阵 , 即 


1 2 3 “zl 
1 Xl 去 ‘ZT! 
Al = 。 9 x: 二 1 十 0.1k,， k=0,1,*,n—1 
2 Re 
1 Tul Tn-l A Sl 


” A, 是 n 阶 希 尔 伯 特 矩 阵 ( 见 (47) 式 ) ,bi ,bs 分 别 是 41 ,4: 的 行 和 . 

(1) 编程 构造 A (4; 可 直接 用 命令 产生 ) 和 b,b; 你 能 预先 知道 方程 组 ix 一 请 和 和 
hsx 一 bs 的 解 吗 ? 令 an 5, 用 左 除 命令 求解 (用 预先 知道 的 解 可 检验 程序 ) 

(2) 令 nx 一 5，7，9,… ,计算 4 和 4 的 条 件数 . 为 观察 它们 是 否 病态 ,做 以 下 试验 ， 
bi ,2 不 变 ,4: 和 4: 的 元 素 Ai (az ，A4: 《n,n) 分 别 加 扰动 后 求解 ;4, 和 A; 不 变 ,bi ,bs 的 
分 量 如 Cn) ， (mn) 分 别 加 扰动 。 后 求解 . 分析 A 和 5 的 微小 挑动 对 解 的 影响 .s 取 10-*， 
. 10s, 107., 

(3) 经 扰动 得 到 的 解 记 任 ,计算 误差 上 守 = 守 上, 与 用 条 件数 全 计 的 误差 相 比 较 . 

2. 分 别 用 雅 可 比 挝 代 法 和 高 斯 - 赛 德 尔 园 代 法 计算 下 列 方程 组 , 均 取 相同 的 初 值 x 
一 (1,1,D7, 观 察 其 计算 结果 ,并 分 析 其 收 候 性 . 


一 9z; 一 10z3 一 1， 5z1 一 Za 一 3Z3 一 一 1 
(1) [ote (2) [ttt 
8zi 十 7zs 十 za 一 4; 一 3zi 十 4zz 十 157s 二 4; 
10zl 十 4z? 十 5zs 一 一 1， 
(3) [ton tro 
5z1 十 7z; 十 10x;3 二 4. 
3. 已 知 方程 组 4x 二 5, 其 中 AER*”**”, 定 义 为 


3 一 1/2 —1/4 
—1/2 3 -12 —1/4 
—1/4 —1/2 3 一 1/2 
A= i 
区 …. 一 1/4 
一 1/4 一 1/2 3 一 1/2 
一 1/4 一 1/2 3 


试 通过 迭代 法 求解 此 方程 组 ,认识 选 代 法 收敛 的 含义 以 及 和 迭代 初 值 和 方程 组 系数 矩阵 性 


5.6 实验 练习 


质 对 收敛 速度 的 影响 . 实验 要 求 ，; 

(1) 选取 不 同 的 初始 向 量 x'% 和 不 同 的 方程 组 右 端 项 向 量 bp, 给 定 和 迭代 误差 要 求 ,用 
雅 可 比 迭 代 法 和 高 斯 - 赛 德尔 选 代 法 计算 ,观测 得 到 的 选 代 向 量 序列 是 否 均 收 敛 ? 若 收 
敛 , 记 录 和 迭代 次 数 ,分 析 计 算 结 果 并 得 出 你 的 结论 ; 

(2) 取 定 右 端 向 量 避 和 初始 向 量 x'eo ,将 4 的 主 对 角 线 元 素 成 倍增 长 若干 次 , 非 主 对 
角 线 元 素 不 变 ,每 次 用 雅 可 比 迭 代 法 计算 ,要 求 迁 代 误 差 满足 ‖ ze 一 x ‖ 。 < 10， 
比较 收敛 速度 ,分 析 现 象 并 得 出 你 的 结论 . 

4. 对 于 5,1. 2 节 假 设 c= 10,al = 二 0.5,as 二 0. 25,0 一 0. 20, 第 一 年 有 50 棵 植物 ， 
且 第 50 年 后 有 600 棵 植物 . 试 分 别 用 追赶 法 、 稀 朴 系 数 和 矩阵 和 满 矩阵 求解 ;车 有 10%% 的 
误差 ,估计 对 结果 的 影响 . 

5. 输电 网 络 : 一 种 大 型 输电 网 络 可 简化 为 rn 六 ] 

图 5. 5 所 示 电 路 , 其 中 Ri ，R: ，…,R, 表 示 负 载 电 请 De 3. 
阻 ,ry ,rz ，… ,表示 线路 内 阻 ,了 ,了 ，,… ,1 表示 负 本 了 a le | 
载 上 的 电流 . 设 电源 电压 为 V. 人 

(1) 列 出 求 各 负载 电流 ,Ts，…, 1, 的 方程 ， Ne 

(2) 设 R=Rs 二 二 R= 二 R， 让 = 二 二 于 二 7 二 7 在 r= 二 1,R= 6， V = 
18, 7 二 10 的 情 沉 下 求 攻 , 1 ,…, 了 1 及 总 电流 To. 

6. 有 5 个 反应 器 连接 如 图 5.6, 各 个 Q 表示 外 部 输入 ,输出 及 反应 器 间 的 流量 
Cm*/min) ,各 个 c 表 示 外 部 输入 及 反应 器 内 某 物质 的 浓度 Cmg/m’). 假定 反应 器 内 的 浓度 
是 均匀 的 ,利用 质量 守 衡 准则 建立 模型 , 求 出 各 反应 器 内 的 浓度 co ~ cs ,并 讨论 反应 器 j 
外 部 输入 改变 1 个 单位 (mg/min) 所 引起 的 反应 器 i 浓度 的 变化 . 


G552 


a, 


Q15=3 


Co=5 

Cl 
cor=10 

一 一 
Co=8 
co3=20 
图 5.6 
7. 有 3 个 结 点 的 钢 架 结构 如 图 5.7, 点 1 受到 100kg 的 外 力作 用 ,点 2 是 固定 支点 ,点 


3 是 滑动 支点 . 利用 力 的 平衡 原理 建立 模型 , 求 出 为 记 ，Fi， 下 ;， 日 :，Vs,，Vs, 讨论 外 力 
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变化 1kg 时 对 各 个 力 的 影响 ， 

8， 种 群 的 繁殖 与 稳定 收获 ; 种 群 的 数量 因 繁 殖 而 增加 , 因 自 然 死亡 而 减少 ,对 于 人 
工 饲养 的 种 群 ( 比 如 家 畜 ) 而 言 , 为 了 保证 稳定 的 收获 ,各 个 年 龄 的 种 群 数量 应 维持 不 变 ， 
种 群 因 上 肉 性 个 体 的 繁殖 而 改变 ,为 方便 起 见 以 下 种 群 数量 均 指 其 中 的 肉 性 . 

种 群 年 龄 记 作 二 1,2,…,n, 当 年 年 龄 的 种 群 数量 记 作 z; ,繁殖 率 记 作 b (每 个 内 
性 个 体 1 年 繁殖 的 数量 ) ,自然 存活 率 记 作 wx 二 1 一 di ,di 为 1 年 的 死亡 率 ) ,收获 量 记 
作 hi , 则 来 年 年 龄 & 的 种 群 数 量 工 ， 应 为 zi > Se Tht = sere hilk = 1,2, ,ne 


1). 要 求 各 个 年 龄 的 种 群 数量 每 年 维持 不 变 就 是 要 使 x = zi Ck == 1,…,n). 

(1) 车 b4 ,ss 已 知 ,给 定 收获 量 hi ,建立 求 各 年 龄 的 稳定 种 群 数量 x 的 模型 (用 矩阵 、 
向 量 表 示 ). 

(2) 设 1 一 5,0 一 久 一 包 一 0 加 一 5 站 一 3 一 % 一 0.4,5 一 % 一 0.6， 如 要 求 太 一 应 
为 500,400,200,100,100, 求 zi 一 z5， 

(3) 要 使 hi~hs 均 为 500, 如 何 达到 ? 

9. 通过 下 面 的 数字 例子 观察 加 权 因 子 w 对 超 松 弛 迭代 收敛 速度 的 影响 . 

已 知 方程 组 


= ls 
Xi 一 4zs 十 X33 十 Xs 二 1， 
Zi 十 zs 一 4zs 十 Zi 一 1， 
Xl 十 Xz 十 Xs 一 4x4 一 1. 
取 w==0.75,1.0,1.25,1.5, 用 SOR 和 迭代 法 求解 ,比较 其 迁 代 结果 (并 与 精确 解 相 比 ). 
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非 线性 方程 求解 


实验 5 讨论 的 线性 代数 方程 组 是 一 类 最 简单 的 方程 组 ,在 实际 问题 中 , 非 线性 方程 和 
方程 组 大 量 存在 ,研究 其 有 效 求解 方法 是 数值 计算 的 基本 任务 之 一 . 

方程 中 的 未 知 数 也 称 为 变量 或 变 元 ,只 含 一 个 未 知 数 的 方程 ( 即 一 元 方程 或 单 变 量 方 
程 ) 可 以 记 作 ， 

f(x)=0. (1) 
该 方程 的 解 也 称 为 方程 的 根 (或 函数 f(x) 的 零点 ). 当 f(z) 为 k 次 多 项 式 时 ,(1) 式 称 为 
次 代数 方程 .对 于 3 次 .4 次 方程 ,虽然 可 以 在 数学 手册 或 互联 网 上 查 到 求 根 公 式 ,但 是 太 
复杂 ,一 般 不 会 有 人 用 它 ;至 于 5 次 以 上 的 方程 就 没有 现成 的 求 根 公式 了 . 求 高 次 代数 方 
程 的 根 是 一 个 基本 的 古老 的 数学 问题 ,比如 在 线性 代数 中 求 & 阶 矩阵 的 特征 根 时 就 要 解 
& 次 代数 方程 , 根据 代数 基本 定理 兴 次 代数 方程 一 定 有 & 个 根 (包括 复 根 , 且 重 根 应 按 重 
数 计算 根 的 个 数 ) ,但 是 不 一 定 能 很 快 算出 它 的 根 . 

一 些 由 实际 问题 列 出 的 方程 ,或 由 其 他 数学 问题 归结 得 到 的 方程 中 还 常常 包含 三 角 
函数 .指数 函数 、 对 数 函 数 等 超越 函数 ,如 sinz,er,lnz 等 ,叫做 超越 方程 , 它 与 £( 宇 2) 次 
代数 方程 都 是 非 线性 方程 .求解 超越 方程 不 仅 没有 一 般 的 公式 ,很 难 求 出 解析 解 ,而 且 若 
只 依据 方程 本 身 ,那么 连 有 没有 解 ` 有 几 个 解 , 也 难以 判断 . 在 本 书 讨论 中 ,如 不 特别 说 明 ， 
指 的 是 求 方程 的 实 根 ( 解 ). 

包含 ”个 未 知 数 的 ma 个 方程 称 为 方程 组 ,可 以 记 作 

F(x) 一 0， (2) 
其 中 x 二 (xi,… ,zx,)' 是 一 个 向 量 , (x)= 二 (f(x),…,f,(x))' 是 一 个 向 量 值 函数 . 当 
族 (x),…,f。(x) 中 至 少 有 一 个 非 线性 函数 时 ,方程 组 (2) 称 为 非 线 性 方程 组 . 多 数 情 况 
下 ,方程 组 中 包含 的 方程 的 个 数 等 于 未 知 数 的 个 数 ( 即 m 二 n). 

求解 非 线 性 方程 (组 ) 的 一 般 方法 是 迭代 法 .采用 非 线 性 迭代 法 时 ,会 出 现 一 类 非常 有 
趣 的 现象 一 一 分 岔 和 混沌 现象 . 

本 实验 讨论 非 线性 方程 (包括 非 线 性 方程 组 ) 的 求解 ,6. 1 节 给 出 几 个 实际 问题 及 其 
数学 模型 ; 6.2 节 讨论 非 线性 方程 的 求解 方法 ,并 推广 到 非 线性 方程 组 ;6.3 节 介绍 


本 


实验 6 非 线 性 方程 求解 
MATLAB 解 非 线 性 方程 和 方程 组 的 命令 ,并 给 出 6. 1 节 问 题 的 解 ;6.4 节 介 绍 
代 引 起 的 分 岔 与 混沌 现象 :6.5 节 布 置 实验 练习 . 


实例 及 其 数学 模型 


6,1.1 路 灯 照 明 


问题 ”在 一 条 20m 宽 的 道路 两 侧 , 分 别 安装 了 一 只 2kW 和 一 只 3kW 的 路 灯 , 它 们 
离 地 面 的 高 度 分 别 为 5m 和 6m. 在 漆黑 的 夜晚 , 当 两 只 路 灯 开 启 时 ,两 只 路 灯 连 线 的 路 面 
上 最 暗 的 点 和 最 亮 的 点 在 哪里 ?如 果 3kW 的 路 灯 的 高 度 可 以 在 3m 到 9m 之 间 变 化 ， 如 
何 使 路 面 上 最 暗 点 的 亮度 最 大 ? 如 盯 两 只 路 灯 的 高 度 均 可 以 在 3m 到 9m 之 间 变 化 ,结果 
又 如 何 ? 

模型 ”建立 如 图 6. 1 所 示 的 坐标 系 , 即 路 面 的 宽度 为 *， 两 只 路 灯 的 功率 分 别 是 P， 
和 P:， 高 度 分 别 是 hl 和 hs. 设 两 只 路 灯 连 线 的 路 面 上 某 点 Q 的 坐标 为 (=,0) ,其 中 0 声 
Zz 委 5s. 假设 两 个 光源 都 可 以 看 成 是 点 光源 ， 
并 记 两 个 光源 到 点 Q 的 距离 分 别 为 ~: 和 
rz ;从 光源 到 点 Q 的 光线 与 水 平面 的 夹 角 分 
别 为 c: 和 wz ,两 个 光源 在 点 Q 的 照度 分 别 
为 石和 五 , 则 


召 非 线 性 和 


0.1 3 


| 


a 人 
nl r2 
其 中 是 量 纲 单 位 决定 的 比例 系数 ,不 妨 记 图 6.1 路 灯 照 明 
&=1, 且 
二 x 放 三 天 十 全 一 
sinal 一 人 这 名 ， sinaz 一 hs hs (4) 
ri h? 十 并 rz MVhi 十 (一 六) 三 
得 到 点 Q 的 照度 为 
ee Ph, . (5) 
WP 十) V+ (sr) )’ 
于 是 , 求 路 面 上 最 暗 点 和 最 亮点 的 问题 化 为 求 C(x) 的 最 小 点 和 最 大 点 . 
先 计算 C(z) 的 驻 点 . C(x) 的 一 阶 导 数 为 
1/ Pihx Phs(s— 7x) 
C (x) 3 | 一 ， (6) 
AR 十 和 75 AW (了 十 (ss 一 工 ))5 


令 CCz) 一 0, 即 


6.1 实例 及 其 数学 模型 


Pihizx Psh,(s— x) A 

该 方程 的 根 为 CCz) 的 驻 点 ,将 驻 点 与 区 间 端 点 z==0 和 xz=s 的 函数 值 比 较 , 就 得 到 C(z) 
的 最 小 点 和 最 大 点 ,但 是 方程 (7) 的 解析 解 是 难以 求 出 的 . 

将 问题 中 的 实际 数据 P ==2, P, = 二 3,h 二 5,hs 二 6,s 二 20 代入 (7) 式 后 , 左 端 记 作 

f(x), 可 以 采用 数值 方法 计算 f(z) 的 零点 . 我 们 将 在 6..3 节 求 解 这 个 方程 , 找 出 路 面 上 
的 最 上 暗 点 和 最 亮点 ,并 讨论 路 灯 高 度 可 以 变化 时 的 情形 . 


6.1.2 均 相 共 沸 混合 物 的 组 分 


问题 与 模型 ”在 化 学 上 ,确定 均 相 共 沸 混合 物 (homogeneous azeotrope) 的 物质 成 分 
(简称 为 组 分 ) 是 一 项 重要 而 困难 的 工作 . 所 谓 共 沸 混合 物 ,是 指 由 两 种 或 两 种 以 上 物质 组 
成 的 液体 混合 物 , 当 在 某 种 压力 下 被 蒸馏 或 局 部 汽化 时 ,在 气体 状态 下 和 在 液体 状态 下 保 
持 相同 的 组 分 . 设 该 混合 物 由 个 可 能 的 组 分 组 成 ,组 分 ; 所 占 的 比例 为 xz;(i 二 1,…，, 7)， 
则 


(7) 


Dri=1, zi>0. (8) 
i=} 


均 相 共 沸 混合 物 应 该 满足 稳定 条 件 , 即 共 沸 混合 物 的 每 个 组 分 在 气体 状态 下 和 在 液 
体 状 态 下 具有 相同 的 化 学 势能 . 在 压强 了 不 大 的 情况 下 ,这 个 条 件 可 以 表示 为 : 
P=7P;, i= 1,",n. (9) 
(9) 式 中 P; 是 组 分 i 的 饱和 汽 相 压强 ,与 温度 工 有 关 , 可 以 根据 如 下 表达 式 确定 : 


lnP. a; Te zi 1,.…,n, (10) 
其 中 a; ,bi,ci 为 常数 . (9) 式 中 7 是 组 分 i 的 液 相 活 度 系 数 , 可 以 根据 如 下 表达 式 确定 : 
lny; = 1— 1n( >7zigy ) >， 4 2 一 1 ,ns (11) 
k=】 


其 中 9y 表示 组 分 i 与 组 分 7 的 交互 作用 参数 ,qi 构成 交互 作用 和 矩阵 0 ,8 不 一 定 是 对 称 
矩阵 . 
对 (9) 式 两 边 取 对 数 ,并 将 (10) 式 ,(11) 式 代 人 ,得 到 


Tt > ay) 十 2 | Es | 1—ai+InP =0, i=1,,n, (12) 
j=1 PEA Dxigi 
kl 

由 于 只 有 当 组 分 i 参与 到 该 共 沸 混合 物 中 时 才 需 要 满足 (12) 式 ,所 以 将 (12) 式 进一步 
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一 1 一 a; 十 lnP 


LO; 
pp > 


工 K 认 


(13) | 


给 定 组 成 均 相 共 沸 混 合 物 的 n 种 物质 ,参数 a;, 6b;,c: 和 交互 作用 矩阵 Q 是 可 以 通过 
实验 得 到 的 ,可 以 作为 已 知 系数 . 在 一 定 的 压强 了 下 ,模型 (8) 式 , (13) 式 描述 了 确定 均 相 
共 沸 混合 物 的 组 分 zx; 的 条 件 . 在 不 考虑 (8) 式 中 xz; 的 非 负 限制 时 ,这 是 含有 十 1 个 方程 
和 2 十 1 个 未 知 数 (z; 和 工 ) 的 非 线性 方程 组 ,需要 用 数值 方法 求解 ,我 们 将 在 6. 4 节 继 续 


讨论 . 
6.2 非 线 性 方程 和 方程 组 的 基本 解法 


6.2.1 图 形 法 与 二 分 法 
为 了 避免 “大 海 捞 针 ”, 解 方程 f(x)==0 的 第 一 步 通常 是 确定 根 的 近似 位 置 或 大 致 范 
围 . 利用 MATLAB 的 函数 图 形 功 能 就 能 帮助 我 们 快速 判断 方程 有 没有 根 , 并 且 确 定 根 的 
近似 位 置 . 例如 : 
xz’ 一 2z1 一 6zx’ 一 1]3x’ 十 8x 十 12 一 0， (14) 
xXx: — 2x— dlnx= 0. (15) 
用 MATLAB 作出 方程 (14) ,方程 (15) 左 端 函数 的 范围 需 经 适当 调整 确 
定 ), 如 图 6. 2 所 示 . 


30 1.0 王 -一 
20 0.5 
10 0 
0 -0.5 广 -一 
-10 -1.0 十 : 
—20 1.5 
30 2.0 > 
-40 2.5 | 
-50 3.0 一 | 
一 2 一 1.5 一 10205 0 0.5 1.0 1.5 2.0 2.5 0 05 10 1.5 2.0 2.5 3.0 3.5 4.0 
(a) (14) 式 的 图 形 (b) (15) 式 的 图 形 
图 6.2 


从 曲线 f(x) 与 zx 轴 的 交点 可 以 看 出 ,在 图 形 所 表示 的 x 的 范围 内 ,方程 (14) 有 4 个 


6.2 非 线 性 方程 和 方程 组 的 基本 解法 


根 分 别 位 于 z= 一 1.75, 一 0.75,1.00,2.40 附近 ;方程 (15) 有 两 个 根 分 别 位 于 zx 一 0. 75， 
3. 40 附近 . 

确定 一 0 一 种 方法 ,是 基于 连续 函数 f(x) 
的 如 下 性 质 . 

设 f(z) 是 连续 函数 , 若 对 于 a 二 b, 有 f(a)，f(6) 过 0, 则 在 (a,6) 内 f(x) 至 少 有 一 
0 即 f(z) 二 0 至 少 有 一 个 根 . 

过 试探 ,确定 区 间 (o,o) 后 ,可 以 用 简单 的 二 分 法 将 区 间 缩 小 ,具体 步骤 如 下 : 

ee Zo 二 (4 十 0)/2, 若 f(xo) 二 0, 则 zo 即 是 根 .否则 ,如 f(a) ， jzo) 去 
0, 令 ai 二 4s 二 xo; 如 f(zxo)， f(b) 过 0, 令 二 zoyb1 二 6b. 在 (a1,61) 内 至 少 有 一 个 根 ， 
且 (a,6) 刁 (4a1;61), 再 取 (a1,6)) 的 中 点 zi 二 (a 十 b1)/2， 如 此 进行 下 去 ,包含 根 的 区 间 
(a ,6b,) 的 长 度 每 次 缩小 一 半 (n= 二 1,，2,…),n 足够 大 时 即 可 达到 满意 的 精度 . 

采用 二 分 法 时 ,区 间 中 点 序列 {zx,) 理 论 上 将 收敛 到 根 的 真 值 ,但 收敛 速度 较 慢 ,所 以 
通常 用 作 下 面 介 绍 的 次 代 方法 的 初步 近似 ( 初 值 ) 


6.2.2 迁 代 法 


我 们 在 线性 方程 组 的 数值 解法 中 学 习 过 和 迭代 法 ,类似 的 思路 也 可 以 用 于 解 非 线性 方 

程 : 将 原 方程 f(x) 二 0 改写 成 等 价 形式 zx 王 p(z)， 选择 适当 的 初 值 xs， 按照 迁 代 公式 

ZUHl = (XT), k= 0,1,. (16) 
计算 , 若 迭 代 序 列 {x,} 收 化 到 x", 则 满足 x* 二 g(x"), 称 为 迭代 函数 9 的 不 动 点 , 即 
为 原 方程 f(z) 二 0 的 根 。 

问题 的 关键 在 于 如 何 构造 和 迭代 函数 pg, 使 迭代 序列 {xz} 以 较 快速 度 收敛 . 下 面 先 看 一 
个 例子 . 

例 1 求 方 程 f(x) 二 =x? 十 x 一 14 的 一 个 正 根 . 

解 ”因为 f(3) 二 一 2,f(4)==6, 所 以 有 一 个 正 根 xz" E (3,4). 实际 上 ,用 二 次 方程 求 
根 公 式 容易 计算 正 根 x* =(V57 一 1)/2<3. 2749. 下 面 我 们 尝试 构造 不 同 的 迭代 函数 
glz) ,再 以 zo 王 3 为 初 值 , 用 迭代 法 求解 . 

Z 一 DCZ) 一 14 一 2Z2， 迭 代 人 公式: ze 一 14 一 2 了; 

工 二 gz (Z) 一 14/(z 十 1) ,迭代 公式 : ziti 王 14/(zx 十 1); 

工 二 p(X) 二 Xx 一 《如 十 7 一 14)/(2z 十 1)， 迁 代 公式 ;Tt1 王 一 (zk 十 一 14)/ (2zi 十 1). 

将 这 3 个 和 迭代 公式 前 5 步 的 计算 结果 列 入 表 6. 1, 可 以 看 出 :gi 根本 不 收敛 ;ws 昌 呈 
现 收敛 趋势 ,但 很 慢 ;qs 收敛 很 快 . 
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实验 
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表 6.1 例 1 的 迭代 结果 


Xo 2 2 3 4 5 
Pl 3.0000 5. 0000 | 一 11.0000 ] 一 107. 0000 
py 3.0000 3. 5000 | 3.1111 ] 3. 4054 3. 1779 3. 3510 
ps 3. 0000 3. 2857 | ”3.2749 | 3.2749 ] 3.2749 3.2749 


进行 


为 了 研究 序列 {x} 收 伍 或 发 散 的 本 质 , 下 面 先 通 过 几何 图 形 观 察 按照 迭代 公式 (16) 


头 方 


迭代 的 过 程 . 在 图 6. 3 中 ,由 ze 得 到 曲线 y 二 p(x) 上 的 Po 点 ,其 纵 坐 标 为 zx， 依 箭 
向 经 直线 > 一 zx 得 到 曲线 > 三 p(z) 上 的 Pi 点 ,其 纵 坐 标 为 xx ， 再 依 箭头 方向 进行 下 


去 ,得 卫 : “Pa yee 可 以 看 出 序列 {z,) 是 收敛 的 . 而 在 图 6. 4 中 , 按 同样 的 办 法 产生 Is 
Pi,P;,…， 可 知 序列 {x,}) 不 收 全 . 


曲线 
曲线 
当 y 


图 形 直 观 地 告诉 我 们 ,之 所 以 有 如 此 截然 不 同 的 结果 ,是 由 于 在 zx" 附近 图 6. 3 中 的 
y 一 9%(Zz) 较 平缓 ,而 图 6.4 中 的 y 二 p(x) 较 陡峭 .通过 作 图 可 以 发 现 , 在 x“ 附近 , 若 
y 王 g(x) 的 斜率 ( 取 绝 对 值 ) 小 于 直线 > 一 z 的 斜率 (为 1), 则 序列 {z,} 将 收敛 ;反之 ， 


二 glx) 的 斜率 ( 取 绝 对 值 ) 大 于 1 时 ,序列 {zx,} 不 收敛 . 


2 


Pi(xi, 加) 


1 
1 
1 
1 
1 
1 
1 
四 


x 


O DX 和 XX x 


[0 XO No YX A 


图 6.3 {x;} 收 伊 图 6.4 {xn} 不 收敛 


关于 和 迭代 法 的 收敛 性 ,理论 上 有 如 下 的 所 谓 局 部 收敛 性 定理 . 
设 g(x) 在 zx* 的 一 个 邻 域内 连续 、 可 微 , 目 |g (zx* )| 过 1, 则 对 于 该 邻 域内 的 任意 初 值 


2zo, 序 列 {z 收敛 于 并 


其 中 


下 面 介绍 收敛 速度 的 概念 . 对 尺 "中 的 序列 {xi) , 记 et 二 x 一 x , 若 
Tk 户 为 一 个 正 数 ， (17) 


ee ef 


| 。 外 表示 某 种 范 数 (对 实数 可 以 认为 就 是 绝对 值 ), 则 称 序列 {xe} 为 王 阶 收敛 . 特别 


线性 方程 和 方程 组 的 基本 解法 


地 ,1 阶 收敛 称 线性 收敛 ,2 阶 收敛 称 平方 收敛 ; 若 p 一 1,，c 一 0 时 (17) 式 成 立 , 通 常 称 {z} 
为 超 线性 收敛. 显然 ,p 越 大 收敛 越 快 
利用 glzi) 在 zx' 的 泰勒 展开 : 


aD = + A 0 
并 注意 到 zi 一 (zz 一 PC ) 和 e@4 二 zi 一 Xx" ,由 (18) 式 可 得 
Ae + a (19) 
于 是 根据 收敛 阶 的 定义 (17) 式 , 若 q(x) 关 0, 则 {zi} 为 1 阶 收敛 (线性 收 敏 ); 若 
G(T )= = (7r’ )=0, J ) 关 0, 则 (za) 为 p 阶 收敛 . 
在 例 1 中 ,对 于 g(x) 二 一 一 ， 因为 g(x) 二 Cz eA ) 关 0, 所 以 (zt) 为 1 阶 


收敛 ;对 于 gs (zx) 二 zx 一 (xz? ee 可 以 算出 gs (zx' )==0,J(x* ) 关 0, 故 {zs} 
为 2 阶 收敛 . 


6.2.3 牛顿 法 


下 面 介 绍 一 种 具体 的 构造 迭代 公式 的 方法 一 一 牛顿 法 . 
对 于 方程 f(z)==0, 将 f(z) 在 zs 作 泰 勒 展开 ,去 掉 2 阶 及 2 阶 以 上 项 ( 即 线性 化 ) 
后 得 


fz) = fx) fF ri) zr zi). (20) 
设 了 (zi) 关 0, 令 上 面 的 f(x) 二 0, 用 zt! 代 圭 右 端的 Z 就 得 到 和 迭代 公式 
© 5 ee (21) 
即 和 迭代 函数 为 
rs Cr + 
p(x) 一 工 RY (22) 


“(22) 式 的 几何 意义 如 图 6. 5 所 示 , 图 中 MN 是 曲线 y= A(z) 过 (zze)) 点 的 切 


线 , 它 与 工 轴 的 交点 即 为 zxt+:. 这 种 方法 称 为 生 顿 切线 法 (简称 牛顿 法 或 切线 法 ), 它 是 线 . 


性 化 与 迭代 法 的 结合 
由 于 
dy flx’ ) 7 Wo ie fm) ' 
9 (x)= Plz 0 (zz ) 一 Fe (23) 
若 z' 是 f(z) 二 0 的 单 根 , 即 f(x* Se (zz ) 天 0, 则 gz ) 一 0 狼人 (z) 天 0， 
这 时 牛顿 切线 法 2 阶 收敛 . 


进一步 的 研究 发 现 , 当 zx' 是 f(x)=0 的 重 根 时 ,g(xz* ) 冯 0, 牛顿 切线 法 只 是 1 阶 收 
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化 ,并 且 重 数 越 高 收 伍 越 慢 
例 1 中 收敛 很 快 的 选 代 公式 reti 一 zx, 一 开店, 正 是 用 的 牛顿 切线 法 . 
yy . "Hp 


| 


0 
图 6.5 牛顿 切线 法 的 几何 意义 图 6.6 制 线 法 的 几何 意义 
为 了 各 免 切线 法 计算 导数 的 麻 估 ,可 以 考虑 用 差 商人 zs 一 Ca 代替 /Cz ) , 送 


代 公 式 变 为 
六 < fxXi) Xe — Te1) 
Be 4 flxi) — f(zre) 


其 几何 意义 如 图 6. 6 所 示 ,用 制 线 PQ 代 蔡 了 原来 的 切线 , 称 为 割 线 法 (或 称 弦 截 法 ). 它 
的 收敛 速度 比 切 线 法 稍 慢 ( 可 以 证 明 ， a 618 ) ， 人 
Xos Zi 开始 it 送 代 ， 


(24) 


“6.2.4 非 线性 方程 组 的 牛顿 法 


求解 单 变 景 非 线性 方程 的 牛顿 法 可 以 推广 到 多 变量 方程 组 的 情形 .方程 组 如 (2) 式 即 
F(x) 二 0, 其 中 天 1 ,Zr )I ,F(X)= (fi (X) ye ， 广 (xz)) 7， 设 X 一 CE a i DT 是 
方程 组 (2) 的 第 & 步 近 似 解 ,与 单 变 量 非 线性 方程 的 牛顿 法 类 似 , 在 *” 作 泰勒 展开 ,线性 
化 后 用 x“+” 代 替 x 可 得 


: : (A 
fiCx tn) = fx) 十 Ef 二 
+ ee ) 0 GHD TO ), = 1,2,.,n. (25) 


记 下 的 雅 可 比 矩 阵 为 


6,2 非 线性 方程 和 方程 组 的 基本 解法 


Cy 
Ori 9xs 9x, 
De 
F(x) = gl go? QT 和 (26) 
af, af ,af 
[9x! dX 9 x 
则 (25) 式 可 写作 
下 CetD ) = 下 OK ) FF XY) CAATD — x ) (27) 
车 r(x) 可 北 , 则 由 (27) 式 可 得 求解 线性 方程 组 (25) 的 牛顿 迄 代 公 式 
XetD = x 一 [PFC )] FC ). (28) 
实际 计算 中 ,在 计算 过 程 的 第 上 步 ,通常 是 先 计算 F(x) 和 F(x 中 ), 再 解 线性 方 
程 组 
有 (xiJAx 一 一 下 (xD ), (29) 
得 到 Ax 后 , 令 
x 一 Yo 十 Ax® (30) 
即 可 . 


例 2 用 选 代 公式 (28) 求 多 方程 组 | 


解 下 (z) 一 人 RS 


Xi—zxi—1 


fi 人 Pe 


上’. Fx) =2| 


Tl 


Vi 


一 


取 初 值 x*=(1,1)7, 最 大 欠 代 次 数 n= 二 10, 相 对 误差 限 tol 王 10- ,编写 如 下 程序 ， 


x0=1;y0=1;n= 10;itol=1e 一 6; 
x(1)=x0;y(1) = y0; 
i=1;u=[1 1];k(1)=1; 


while (norm(u)>tol x norm(CLx(iD ,yC) J])) 


A=2x [xD) ,yD) ;x , — yj; 


b=[4—xC)°2— yD)°2,1~—x()°2+ yD)°2]'; 


U= A\b; 
X(i 十 1]) 一 xX(iD 十 uC1); 
ylit+1)=y(i) +u(2); 
i=i 十 1;K(CD =i; 
if(i>n)errorCn is full'); 
end 

end 

[k',x',y"] 


| 
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结果 如 表 6. 2 所 示 : x 中 (二 x ) 与 精确 解 x 二 《VY5/2, V3/2)! 的 误差 已 不 超过 tol. 
| 表 6.2 例 2 的 和 迭代 结果 


i . Et 

1 (1.750000,1.250000) 
2 (1.589286,1.225000) 
3 (1.581160,1. 224745) 
4 (1.581139,1. 224745) 
5 (1.581139,1.224745) 


有 定理 表明 ,牛顿 迁 代 公式 (28) 是 超 线性 收敛 的 ( 即 收敛 阶 不 小 于 1) , 稍 加 条 件 就 至 
少 是 平方 收敛 的 . 

在 公式 (28) 中 每 一 步 都 要 计算 雅 可 比 和 矩阵 F (xz ), 当 函数 FCz) 比 较 复 杂 时 很 不 方 
便 , 所 以 希望 能 用 较 简单 的 矩阵 4 近似 F(x). 为 此 ,将 (28) 式 变 为 


x 二 x I (A® )-!F(x'®) , (31) 
仿照 割 线 法 中 用 差 商 帮 2 一 六 < 代 巷 Cz) 的 做 法 ,使 4" 满 中 
k —1 
A (xP rx) F(x®)— F(x). (32) 
但 是 (32) 式 不 足以 确定 A ,通常 再 用 迁 代 公式 a 
A® 一 AD 十 AAA —7 人 (C33) 


计算 之 . (31) 式 ~(33) 式 所 采用 的 方法 称 为 拟 和 牛顿 法 . 至 于 如 何 确定 (33) 式 中 的 A4% ,又 
有 不 同 的 构造 方法 ,有 兴趣 的 读者 可 参看 其 他 有 关 书 籍 . 


6.3 MATLAB 解 非 线 性 方程 和 方程 组 


下 面 介绍 求解 非 线 性 方程 和 方程 组 的 MATLAB 命令 ,虽然 它们 也 可 用 于 解 线性 方 
程 和 方程 组 . 


6.3.1 fzero 的 基本 用 法 


fzero 命令 用 于 求 单 变量 方程 的 根 ,所 采用 的 算法 主要 是 二 分 法 、 割 线 法 和 逆 二 次 插 
值 法 等 的 混合 方法 .fzero 至 少 需要 两 个 输入 参数 : 函数 .和 迭代 初 值 (或 有 根 区 间 )， 

如 果 方 程 左 端的 函数 形式 很 简单 ,可 以 不 必 编 写 函 数 M 文件 ,而 是 直接 用 MATLAB 
提供 的 inline 函数 输入 方程 左 端的 函数 Cinline 函数 返回 一 个 字符 串 表 示 的 函数 的 句柄 ). 
例如 ,对 于 方程 x’; 一 2x 一 5 二 0, 可 用 如 下 命令 求解 : 


6.3 MATLAB 解 非 线性 方程 和 方程 组 


fzerolinline('x*3—2 x x~5'),0) % 初 值 取 0 
或 关 

fzeroCinline('x"3 一 2x x—5"),[1,3]) % 有 根 区 间 取 [1,3]( 函 数 在 区 间 端 点 必须 异 号 ) 
均 可 以 得 到 实 根 2. 0946. 

值得 注意 的 是 , fzero 实际 上 求 得 的 不 一 定 是 函数 的 零点 ,而 只 是 函数 值 发 生变 号 的 
点 .对 于 连续 六 数 , 这 个 点 就 是 近似 零点 ;但 对 于 不 连续 的 蔓 数 ,这 个 点 很 可 能 只 是 一 个 间 
淅 点 ( 且 在 该 点 两 边 ,函数 值 异 号 ) .例如 ,如 果 输 入 

fzero( @tan,{— 1,1]) 
将 得 到 正切 函数 的 零点 (0). 但 是 ,如 果 输 入 

fzeroC@tian:,f1,2]) 
将 得 到 近似 间断 点 1. 5708( 即 x/2). 

同样 道理 ,即使 函数 是 连续 函数 而 且 有 零点 ,但 如 果 在 该 零点 附近 范 数 值 没有 变 号 ， 
则 fzero 也 找 不 到 这 个 零点 (除非 输入 的 初 值 就 是 零点 ). 例如 ,如 果 输 入 


fzerolinlinel'x°2') , 1) 


得 到 的 输出 为 “NaN”( 非 数 ). 


MATLAB 中 的 命令 一 般 都 有 多 种 可 选 的 参数 输入 方式 ,也 可 以 输出 多 种 计算 结果 ， 
供用 户 选 用 . 例如 ,fzero 命令 的 最 一 般 的 调用 方式 是 ， 

[x,fv,ef,out| = fzero(@f,x0,opt,P1,P2,...) 
其 中 f 是 函数 名 ,x0 是 迭代 初 值 (或 有 根 区 间 ) ,这 是 两 个 必须 输入 的 参数 .opt 是 一 个 结 
构 变 量 , 含 有 用 于 控制 程序 运行 的 控制 参数 ,实验 7 将 详细 介绍 其 意义 ,用 户 不 指定 或 指 
定 为 [] 时 将 采用 缺 省 值 :P1,P2,.… 是 传 给 f 函数 的 参数 (如 果 需 要 的 话 ). 

在 输出 列表 中 ,x 是 变 号 点 的 近似 值 ,fv 是 x 点 所 对 应 的 函数 值 ,ef 是 程序 停止 运行 
的 原因 ,out 是 一 个 结构 变量 ,其 中 包含 程序 运行 和 停止 时 的 一 些 相关 信息 .例如 ,如 果 
输入 

[x,fv,ef,out]=fzero(inline('x*3—2*xx—5'),0) 


将 得 到 以 下 输出 结果 : 


x = 2.0946 
fv = 一 8.8818e 一 016 
ef= 1 % 正 数 (1) 表 示 找 到 异 号 点 ,人 负数 (一 1) 表 示 没 有 找到 蜡 号 点 


out= 
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验 6 非 线 性 方程 求解 


iterations: 39 % 迭代 了 39 次 (此 显示 的 意思 是 out. iterations = 二 39, 下 同 ) 
funcCount: 39 % 函数 被 调用 了 39 次 
algorithm: 'bisection，interpolation “ % 算法 是 二 分 法 和 插值 法 


6.3.2 fsolve 的 基本 用 法 


fsolve 命令 用 于 非 线 性 方程 组 的 求解 (当然 也 可 以 用 于 方程 求 根 ,但 效果 一 般 不 如 


fzero 程序 ) ,最 一 般 的 调用 方式 是 : 


[x,fvyef,out,jac] = fsolve(@F,x0,opt,P1,P2,...) 


其 中 输入 列表 和 输出 列表 与 上 面 对 fzero 的 说 明 类 似 ,只 是 opt 中 可 以 使 用 的 控制 参数 更 
多 ,out 中 能 够 输出 结果 (x 点 ) 处 梯度 向 量 的 范 数 (实际 上 是 1- 范 数 , 即 分 量 按 绝对 值 取 最 
大 的 值 ) ,还 可 以 输出 x 点 所 对 应 的 雅 可 比 矩 阵 jac. 


好 十 二 一 


2 一 


x Xs 


4 
用 fsolve 求解 前 面 的 例 2 ,加 方程 组 | 1 来 说 明 其 用 法 ， 


首先 建立 如 下 exam0602fun. m 文件 计算 函数 值 ， 


function y= exam0602fun(x,a,b,c, d) 


y(1)=x(1)"2+ax x(2)"2—b; % 当 a=1,b 二 4 时 为 第 1 个 方程 
y(2)=x(1)*2+coxx(2)"2—d; % 当 c= -1,d 三 1 时 为 第 2 个 方程 
输入 程序 : 

x0=[2,2]; % 初始 值 

[x,iv, ef, out,jac]= fsolve( @exam0602fun,x0,[],1,4,~1,1) 

输出 结果 为 : 


Xx 一 (1.5811,1.22477); 
fv =1.0e 一 009* (0.7477,—0.7474); 
ef= 1 % 1 表示 收敛, 一 1 不 收敛 ,0 表示 达到 了 和 迭代 或 函数 调用 的 最 大 次 数 
out= | 
iterations :,4 
funcCount : 15 
algorithm : 'trust 一 region dogleg' % 算法 : 置信 域 方 法 


firstorderopt : 3.6622e 一 009 % 结果 (x 点 ) 处 梯度 向 量 的 1- 范 数 
jac = [3.1623°. 2.4495 


3.1623- 一 2.4495]] 


可 见 , 当 我 们 只 是 改变 a,b,c;d 的 值 时 ,没有 必要 修改 函数 M 文件 exam0602fun. m， 


6.3.3 


roots 的 基本 用 法 
对 于 单 变量 代数 方程 求 根 , 即 当 f(z) 为 一 元 多 项 式 时 ,MATLAB 还 提供 了 一 个 专 


门 的 命令 “roots”. 两 个 相关 的 命令 是 ， 


输入 多 项 式 的 系数 c( 按 降 窒 排列 ) ,输出 r 为 f(x)==0 的 全 部 根 (包括 复 根 ); 
输入 f(z) 二 0 的 全 部 根 r, 输 出 c 为 多 项 式 的 系数 ( 按 降 窒 排列 ). 


r=roots(c 
c= poly(r) 


最 后 指出 ,在 MATLAB 符号 工具 箱 中 ,还 有 一 个 用 于 方程 (组 ) 求 解析 解 的 命令 


) 


“solve”( 当 无 法 得 到 解析 解 时 ,有 时 也 会 
下 面 用 MATLAB 软件 解决 6.1 节 提 出 的 两 个 问题 . 


6.3.4 路 灯 照 明 ( 续 ) 


上 C 


1. 求 路 面 上 的 最 暗 点 和 最 亮点 


首先 由 (5) 式 和 (6) 式 并 代 人 所 给 


(z) 有 3 


6.3 MATLAB 解 非 线 性 方程 和 方程 组 


尝试 数值 解 ) ,这 个 程序 这 里 就 不 详细 介 


最 小 点 ， 0 端点 zx 一 20 难以 确定 ). 


-3 
6 


再 以 < 二 0,10,20 为 初 值 ,用 fzero 命令 解 方程 (7) ,并 计算 所 得 解 的 照度 CCz). 编写 以 下 


0.10 


下 面 我 们 用 数值 解法 求 方程 (7) 的 根 . 先 将 数据 代入 (7) 式 编写 函数 M 文件 : 


Con 
| 
= | 
4 10 19 20 0 5 10 15 20 
(a) 路 灯 照 明 C(x) 的 图 形 (b) 路 灯 照 明 Cx) 的 图 形 


function y= zhaoming x) 
y=2x*5xx/(5° 2+X 2)°(5/2)—3x6* (20— x)/(6°2+ (20— x) “2)°(5/2); 


程序 : 


x0=[50,10,20]; 


for k=1 


:3 


图 6.7 


绍 了 . 


的 实际 数据 P= 二 2, P= 二 3,hi 二 5,hs 二 6,s 二 20, 用 
0 (z) 及 CCz) 在 10,20] 内 的 图 形 , 如 图 6.7, 可 以 粗略 地 看 出 ,大 体 
点 ,分别 在 x 二 0 附近 .zx= 王 9 和 xz=10 之 间 ,z=20 附近 . (9,10) 内 的 是 


wa 


实验 6 非 线 性 方程 求解 


x(k) =fzero(@zhaoming,x0(k)); 
c(k) =2x5/(5°2+x(k)*2)*(3/2)+3x6/(6°2+ (20— x(k))"°2)°(3/2); 
end S 


Lx;c] 


运行 后 得 到 3 个 驻 点 及 相应 的 照度 ,作为 比较 ,也 算出 区 间 端 点 的 照度 ,结果 如 
表 6. 3 所 示 . 由 此 可 知 ,zx 二 9. 3383 是 CCz) 的 最 小 值 点 ,z 二 19. 9767 是 C(x) 的 最 大 值 
点 , 即 路 面 上 离 2kW 路 灯 9.3383m 处 最 暗 ,19. 9767m 处 最 亮 . 


表 6.3 ”路灯 照明 的 计算 结果 


0 0.02848997 9. 33829914 20 


19. 97669581 
0.08447655 
2. 讨论 如 果 3KW 路 灯 的 高 度 可 以 在 3m 到 9m 之 间 变 化 ,如 何 使 路 面 上 最 暗 点 的 照 
度 最 大 . 


0.08197716 0.08198104 0.01824393 0.08447468 


重新 将 (5) 式 记 为 
Pih P,h, 

Clzr,h ) 二 9 (34) 

VAT VOITG— zy) 

则 : 

aC 3 Pihiz 3 P,h,(s— zx) . (35) 

9 VChi + zi)s Vhs + (sO— zr) )s 

2 

QE P, 一 3 P,h; (36) 


ahs VR TG x) ) VE TFG 
为 了 求 出 CCz, hs) 的 驻 点 ,可 以 直接 令 上 面 两 个 偏 导 数 为 0, 将 所 给 的 实际 数据 代入 , 求 
解 关 于 x 和 有 hh; 的 方程 组 (请 读者 试 试 ). 
可 以 将 解 方程 组 的 问题 转化 为 解 一 个 方程 . 令 (36) 式 等 于 零 ,容易 得 到 


hs 一 方 G 一 局 ， (37) 


代入 (35) 式 并 令 其 等 于 零 , 得 到 

9vV3Pihir 4P _ 

VT Fr) (一 工 )3 
将 实际 数据 代入 , 像 上 面 解 方 程 (7) 一 样 , 用 fzero 命令 解 方程 (38) ,得 到 二 后 再 由 (37) 计 
算 相应 的 h,( 只 保留 3m 到 9m 间 的 值 ) ,再 从 (34) 式 算出 CCz, hs). 得 到 的 结果 是 : 

工 一 9.5032， hz = 7.4224, C(x, h,) = 0.018556. (39) 

即 当 h, 二 7. 4224 时 ,最 上 暗 点 x 二 9. 5032 的 照度 达到 最 大 ,为 0.018556(《 可 与 前 面 hs, 二 6 的 
结果 比较 ). 


(38) 
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为 了 证 明 结 果 的 正确 性 ,可 以 计算 C(x, hs) 在 xz 二 9.5032,hz 二 7, 4224 的 二 阶 偏 导 


i 8 区 
数 ,得 到 2 5 一 1. 0565>0， 0 2536 过 <0, 表明 的 确 使 最 暗 点 的 照度 最 大 . 


gx an? 
3， 讨 论 如 果 两 只 路 灯 的 高 度 均 可 以 在 3m 到 9m 之 间 变 化 的 情况 . 


将 照度 记 作 CCz， hi， ha). 与 上 面 类 似 ,由 了 一 0 容易 得 到 

1 
Pi 一 一 工 (40) 
5 一 0 得 到 


将 各 和 ha((37) 式 ) 代 人 (35) 式 并 令 信和 


= 二 (41) 


于 是 可 以 直接 得 到 解析 解 
一 5 (42) 
VPi + VP: 

可 见 , 此 时 最 暗 点 的 位 置 只 与 路 灯 的 功率 和 道路 宽度 有 关 . 特别 地 , 当 两 只 路 灯 的 功 
率 相同 时 ,最 暗 点 在 道路 正中 . 进而 可 以 求 出 使 最 早点 的 照度 达到 最 大 的 路 灯 高 度 hi 
和 hs. 

将 本 例 中 的 实际 数据 Pj ==2,P,==3,s 二 20 代 人 (42) 式 ,得 到 x 二 9. 3253, 进而 可 以 
得 到 六 一 6.5940，/ 一 7.5482. 

由 《37) 式 和 (40) 式 可 知 , 最 瞳 点 x 处 的 光线 与 路 面 的 夹 角 满足 


tanal 一 tanay 一 一 ， (43) 


2 
即 w 二 az 二 35"16', 这 个 角度 与 路 灯 的 功率 和 道路 宽度 均 无 关 . 
读者 可 讨论 2 只 以 上 路 灯 的 情形 ,如 篮球 场 四 周 安装 一 定数 量 的 照明 灯 . 


6.3.5 均 相 共 tt 沸 混 合 物 的 组 分 ( 续 ) 


模型 (8),(13) 是 含有 ?十 1 个 未 知 数 的 非 线 性 方程 组 ,可 以 用 MATLAB 优化 工具 包 
的 fsolve 求解 .注意 到 (8) 式 是 一 个 简单 的 线性 等 式 , 可 以 从 中 消去 1 个 未 知 数 ,这 通常 会 
使 求解 的 效果 更 好 . 例如 ,我 们 从 (8) 式 解 出 


xX, 二 1 一 a C44) 
并 将 它 代 入 (13) 式 ,得 到 含有 7 个 未 知 数 闵 人工 二 (zi ,Xz，… ,Xs-;， 了 ) 的 非 线性 方程 组 . 


具体 地 ,给 定 n=3 种 物资 : 丙酮 、 乙 酸 甲 脂 、 甲醇 ( 记 它 们 分 别 是 物质 1， 2,3) ,对 应 的 
参数 al，c 和 交互 作用 和 矩阵 Q 如 下 : 


gle 


实验 6 


非 线 性 方程 求解 


4 二 160.388， 
已 二 2787. 50， 
cl 一 229.66， 
Q=[1.0 0. 48 0.768 
1.55 1.0 0. 544 
0.566 0.65 1.0] 


az 二 16.268, 
2 一 2665. 54， 
cz 一 219.73， 


首先 编写 如 下 的 函数 M 文件 : 


function f= azeofun(XT,n,P,a,b,c,Q) 
XCm 一 1; 
fori=1:n 一 | 
x(iD 三 XTCD ; 
xn) 三 XCn) 一 X(Ci); 
end 
T= XT(n); 
p=iog(P); 
for i=1:n 
dt) 三 XxQGD1:.n); 
dd(iD) 三 xCiD/d(iD; 
end 
for i=1:n 
fC) =x(i) x (bi)/C(T+ c(i)) + log(x* QCi,1 


end 

然后 用 所 给 数据 编程 , 作 如 下 计算 : 
n= 3; 

P=760; 


a=[16.388,16.268,18.6071'; 
b=[2787.50,2665.54,3643.31]'; 
c= [229.66,219.73,239.73J'; 
Q=[1.0 0.48 0.768 

1.55 1.0 0.544 

0.566 0.65 1.0]; 
XxT0= [0. 333,0.333,50]; 
[XT,Y]=fsolve( @azeofun, XT0,[ |,n,P,a,b,c,Q) 


4a3 一 18. 607 ; 
2 一 3643.21; 
c 一 239.73; 


在 压强 了 二 760mmHg 下 ,为 了 形成 均 相 共 沸 混合 物 , 求 温度 荆 和 组 分 :分别 是 多 少 ? 


:n+ ddxQ(1 :nD 一 atD 一 1 十 p); 


6.4 ”分 俩 与 混沌 现象 


XT = [0.2740 0.4636 54.2560] 
Y=1.0e—006 * [0.4195 —0.3112 0.2083] 


即 丙酮 .乙酸 甲 脂 . 甲 醇 组 成 均 相 共 沸 混合 物 时 的 比例 分 别 为 27. 40%,46. 36%， 
26. 24% ,温度 为 54.2560'C. 找 到 这 样 的 组 合 后 ,通常 可 以 通过 化 学 实验 验证 结果 是 否 
正确 . 

在 上 面 的 计算 中 ,我 们 对 初 值 XT0 的 取 法 是 : 3 种 物质 各 占 约 1/3, 温 度 为 50%C. 如 
果 取 其 他 初 值 , 是 否 还 可 以 得 到 其 他 均 相 共 沸 混合 物 呢 ? 例如 ,在 温度 仍然 为 54 附近 
时 ,如 果 我 们 希望 看 看 后 两 种 物质 ( 即 不 含有 丙酮 ) 能 否 组 成 均 相 共 沸 混合 物 ,可 以 用 初 值 
XT0 二 [0，0. 5，54] 尝试 一 下 ,结果 得 到 : 乙酸 甲 脂 、 甲醇 的 比例 分 别 | 为 67. 66%%， 
32. 34%% ,温度 为 54. 3579 时 ,组 成 均 相 共 沸 混合 物 . 类 似 地 , 可 以 得 到 其 他 的 均 相 共 沸 
混合 物 ,结果 归纳 如 表 6.4 所 示 . 


表 6.4 均 相 共 沸 混合 物 的 组 分 的 计算 结 


初 值 解 
XT0 Xz Xs T 
[0. 333, 0.333, 50] 0. 2740 0. 4636 0. 2624 54. 2560 
[0, 0.5, 54] 0. 0000 0. 6766 0. 3234 54. 3579 
[0.5, 0, 54] 0. 7475 0. 0000 0. 2525 54. 5040 
[0.5, 0.5, 54] 0. 5328 0. 4672 0. 0000 55. 6764 


请 读者 试 试 : 1) 选 择 其 他 的 初 值 , 是 否 还 可 以 找到 其 他 的 解 ? (2) 如 果 不 作 (44) 式 
的 代 换 ,结果 有 没有 什么 不 同 ?(3) 改 变 程序 的 控制 参数 (如 算法 、 精 度 等 ) ,结果 有 没有 什 
么 不 同 ? 


6.4 分 贫 与 混沌 现象 
让 我 们 通过 实验 2 中 2. 4. 1 节 离 散 形式 的 阻 潜 增 长 模型 来 观察 分 岔 与 混沌 这 种 有 趣 
的 现象 . 原来 的 非 线 性 差分 方程 模型 为 ( 见 实验 2(48) 式 ) 
ze 一 习 一 r(1 一 全)jze A (45) 


其 中 xz 是 第 & 代 的 种 群 数量 ,~ 是 固有 增长 率 ,NN 是 种 群 最 大 容 

取 N=1,r 二 0.3, 1.8, 2.2, 2.5, 2.55, 2.7, ee Ls 按照 方程 (45) 用 
MATLAB 计算 zx, 得 到 的 结果 如 表 6.5 和 图 6.8( 实 验 2 中 曾 得 到 x==0.3, 1. 8, 2.5 的 结 
果 ,为 比较 起 见 , 这 里 一 起 给 出 ), 
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实验 6 非 线性 方程 求解 
表 6.5 模型 (45) 不 同 r 的 计算 结果 
k Zr 一 0.3) Zr 一 1.8) Zr 一 2.2) Xlr=2.5) | zi(r=2.55) xi(r=2.7) 
0 0. 1000 0.1000 0. 1000 0.1000 0.1000 0.1000 
A 

1 0.1270 0. 2620 0. 2980 0. 3250 0. 3295 0. 3430 
2 0. 1603 0. 6100 0.7582 0.8734 0. 8929 0.9514 
3 0. 2006 1.0382 1.1615 1.1498 1.1368 1.0762 
4 0.2487 0. 9668 0.7488 0.7192 0.7403 0. 8548 
5 0. 3048 1.0246 1.1626 1.2241 1.2306 1.1899 
21 0.9881 1.0007 1.1628 1.2250 1. 2296 1.1370 
22 0.9916 0. 9994 0.7462 0.5359 0. 5096 0.7165 
23 0.9941 1.0005 1. 1628 1. 1577 1. 1468 1. 2649 
24 0. 9959 0. 9996 0.7462 0.7012 0.7174 0.3601 
41 1. 0000 1. 0000 1.1628 1.2250 1.2350 0.9580 
42 1. 0000 1. 0000 0.7462 0.5359 0.4951 1.0667 
43 1. 0000 1. 0000 1.1628 L.A577 1. 1325 0. 8747 
44 1. 0000 1. 0000 0.7462 0.7012 0.7499 1. 1707 
45 1. 0000 1. 0000 1. 1628 1. 2250 1. 2282 0.6312 
46 1. 0000 1. 0000 0.7462 0.5359 0.5136 1. 2597 
47 1. 0000 1. 0000 1.1628 1.1577 1. 1506 0. 3763 
48 1. 0000 1. 0000 0.7462 0.7012 0.7086 1.0100 
49 1. 0000 1. 0000 1.1628 1. 2250 1. 2351 0. 9827 
50 1. 0000 1. 0000 0.7462 0. 5359 0. 4946 1.0286 


上 述 结果 表明 ,r 二 0.3 和 1.8 时 > 送 趋 向 六 = 王 1, 可 看 作 种 群 数量 代 代 收敛 ijr 二 2.2 


时 立 不 再 趋向 六 =1, 而 是 有 2 个 


女 伍 的 子 序列 ,分 别 趋向 0. 7462 和 1. 1628 , 称 为 周期 2 


收敛 ,可 看 作 种 群 数量 隔 代 收 敏 ;r 二 2.5 时 立 有 4 个 收敛 的 子 序列 ,分 别 趋向 0. 5359， 
1. 1577,0. 7012 和 1. 2250 , 称 为 周期 4 收敛 jir 二 2.55 时 zt 有 8 个 收敛 的 子 序 列 , 称 为 周 
期 8 收敛 ;r = 二 2.7 时 立 没 有 任何 收敛 的 子 序列 ,种群 数 量变 化 没有 任何 规律 

让 我 们 接着 实验 2 中 例 6 所 作 的 分 析 继 续 进 行 下 去 : 


6.4 分 岔 与 混沌 现象 


6.8 模型 (45) 不 同 r 的 计算 结果 ( 表 6.5 的 图 示 ) 


(1) 在 变量 和 参数 代 换 y, 一刀 二 生计 16 一 "十 1 下 ,方程 (45) 化 简 为 ( 见 实验 2 中 
(55) 式 ,《56) 式 ) 


yn = fyr) = byr(l—y), k=0,1,2, (46) 
由 平衡 点 ?一 多 二 1 一 1/5( 相 应 于 xz 二 NN) 稳 定 的 条 件 | 了 Cy* )| 雪 1, 得 到 1I<0<3, 即 
7 之 2, 所 以 r+ = 二 0.3 和 r=1.8 时 zi 一 N( 即 yt 一 y). | 
(2) 为 了 解释 ~ 二 2.2 时 zt 有 2 个 收敛 子 序列 的 现象 (周期 2 收敛 ) ,应 该 考察 res 
与 ze( 即 yers 与 y) 的 关系 . 由 方程 (46) 可 推 得 


YEH2 = jyel) = f(f(y)) = 产 2(y)， k=0,1,2,. (47) 
求 方程 (47) 的 平衡 点 需 解 代数 方程 
y= f(y) = 60y1 yl oy(l my)1. (48) 
方程 (48) 的 根除 了 y= 二 1 一 1/6 外 ,还 有 两 个 是 
7 3 . 
i 20 8 a 


它们 满足 
0< 和 < 六 <y <1， yr = f(y?), yz 一 ). (50) 
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平衡 点 :稳定 的 条 件 是 | (AD))1<1, 可 以 算出 


FH)) = FYIF Cy) = 62) (1— 2y2). S21 
以 (49) 式 代入 (51) 式 计算 可 得 , 当 
b 二 1 十 V6 过 3,449 即 r 2.449 (52) 


时 y 让 ?稳定 ;否则 ,yrs 不 稳定 . 前 面 看 到 六 一 2. 2 时 Zk 的 2 个 收敛 子 序列 XxXI 一 
0.7462，ZXax+1 阅 X27 二 1.1628, 读者 可 以 验证 ,zz 正好 对 应 于 按照 (49) 式 计算 的 yr2. 

(3) 当 /0>>3.449( 即 ~ 之 2. 449) 时 并 ?不 再 稳定 ,而 我 们 看 到 ”~ = 一 2.5 时 有 4 个 收 
敛 子 序列 的 现象 (周期 4 收敛 ) , 循 着 上 面 的 思路 ,应 该 研究 

i = Fs k=0,1,2,: (53) 
用 类 似 的 方法 可 以 得 到 ,车 
3.449 二 6 一 3.544， 即 2.449 < 二 rr 二 2.544. | (54) 
方程 (53) 有 4 个 稳定 平衡 点 . 

(4) 继续 上 面 的 做 法 ,对 于 方程 (45) 或 (46) 可 以 讨论 序列 zi 或 y: 有 2 个 (n= 二 0,1， 
2,…) 收 敛 子 序列 的 问题 (周期 2" 收 敛 ) ,收敛 条 件 完全 由 2 的 大 小 决定 . 记 有 2 个 收 敏 子 
序列 的 56 的 上 限 为 5, ,上 面 的 分 析 给 出 : 和 王 3:0 二 3. 449,0: 一 3. 544. 进一步 的 研究 表 
明 , 当 xce 时 久 一 3.57, 若 0>>3.57( 即 之 2.57), 就 不 再 存在 任何 2" 收 化 子 序列 ,前 面 
r 一 2.7 的 计算 结果 就 是 这 种 情况 ,序列 立 的 趋势 似乎 呈现 一 片 混乱 ,这 就 是 所 谓 混 沌 
(Chaos) 现 象 . 

混沌 现象 的 一 个 典型 特征 是 对 初始 条 件 的 敏感 性 . 表 6.6 和 图 6.9 给 出 了 = 一 2. 7， 
初 值 z 王 0.1 和 0. 1001 时 计算 结果 的 比较 ,可 以 看 出 , 初 值 的 微小 扰动 (0.1% 的 误差 ) 对 
整个 过 程 的 巨大 影响 ,如 二 23 时 两 个 x 相差 一 信 以 上 , 真 可 谓 “ 差 之 毫 厘 , 失 之 千 里 ”， 
著名 的 “ 蝴 屿 效应 ”说 的 就 是 这 个 意思 ， 

应 该 指出 的 是 ,我 们 的 对 象 一 一 模型 (45) 是 完全 确定 的 ,没有 任何 随机 因素 ,但 
是 混沌 现象 显示 的 结果 却 是 无 规则 的 .好 似 随 机 的 ,这 是 在 一 定 条 件 下 由 非 线 性 迭代 过 程 
引起 的 . 


表 6.6 模型 (45}r=2.7 不 同 初 值 的 计算 结果 


k Xr (T=2.7) | zx (r=2,7) k -ix(r=2.7)|zr.(r=2.7) k XA (r=2.7)| zi(r=2.7) 
] | 有 
0 0. 1000 0. 1001 : : : 46 1.2597 0.7248 
| -一 下 ts 
1 0. 3430 0. 3433 21 1.1370 0.8442 47 0.3763 1. 2633 
上 | 
2 0.9514 0.9520 22 0.7165 1. 1993 48 1.0100 0. 3651 
3 1.0762 1.0753 23 1.2649 上 0. 5540 49 0. 9827 0. 9909 
4 0. 8548 0. 8566 24 0. 3601 1.2211 50 1.0286 1.0153 
5 1. 1899 1.1883 : : ; 
人 


6.4 分 贫 与 混沌 现象 


0 10 20 30 40 50 0 10 20 30 40 50 
图 6.9 模型 (45)r=2.7 不 同 初 值 的 计算 结果 { 表 6.6 的 图 示 ) 


(5) 5 之 3.57 即 ~ 之 2. 57 以 后 ,虽然 不 再 存在 任何 周期 2 收敛 ,但 是 将 出 现 许多 周期 
妨 (一 3，5，…) 收 敛 的 窗口 ,这 表明 混沌 之 中 仍 有 其 内 部 的 规律 性 读者 不 妨 取 6 二 3. 83 
尝试 一 下 ,看 看 会 出 现 什么 情况 . 


我 们 看 到 , 随 着 r 或 6 的 增加 ,序列 zi 收敛 性 出 现 分 岔 ; 一 分 二 ,二 分 四 ，…… ,直至 
混沌 .有 趣 的 是 ,分 岔 和 混沌 现象 也 并 不 是 完全 没有 规律 ,例如 大 们 发 现 如 下 极限 
站 (55) 
noo DrH 一 如 


就 是 一 个 普遍 存在 于 不 同 分 贫 和 混沌 现象 中 的 常数 ,通常 称 之 为 Feigenbaum 常数 . 这 表 
明 分 岔 和 混 荡 现象 实际 上 有 其 内 在 的 规律 性 . 

在 本 节 的 最 后 ,我 们 用 MATLAB 编程 来 画 出 非 线性 选 代 序 列 随 着 参数 变化 的 收敛 、 
分 贫 和 混沌 现象 图 . 可 以 首先 编写 如 下 程序 : 


function chaos(iter_fun,x0,r,n) ”% 该 函数 没有 返回 值 ;iter fun 是 迭代 函数 (句柄 );x0 是 迭代 初 值 ; 
kr=0; 
for rr=r(1) : r(3) : r(2) % 输入 中 [r(1),r(2)j 是 参数 变化 的 范围 ,r(3) 是 步 长 
kr=kr+1; 
ykr,1)= feval(iter fun,x0,rr); 
for i=2 : n(2) % 输 入 中 n(2) 是 迭代 序列 的 长 度 ,但 画图 时 前 n(1) 个 迭代 值 被 舍弃 
yCkr,i) = feval(iter_fun,yCkr,i— 1) ,rr); 
end 
end 
piot(LrC1) : r(37 : rC2) ,yy : nC(D + 1 : n(2)) ,kk.); 


对 本 例 ,迭代 函数 为 


function y= iterQ1(x,r) 
y=rx*xxx (1— x); 
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输入 如 下 命令 : 
chaos(@iter01,0.5,[2,4,0.01],[100,200]) 


可 以 得 到 图 6. 10 所 示 的 分 盆 和 混沌 图 ( 横 坐 标 表 示 变 化 的 参数 , 纵 坐标 表示 和 迭代 序列 的 
极限 ). 


a : +7 

Ge Na 
本 。 改 

机 Nd 

OQ.I- EL 


095 22 24 2.6 28 30 32 3 3 3.8 4.0 
图 6.10 非 线性 差分 方程 (45) (或 (46) ) 解 的 收 化 .分 岔 和 混沌 现象 


6.5 实验 练习 


1. 掌握 用 MATLAB 软件 求解 非 线 性 方程 和 方程 组 的 基本 用 法 ,并 对 结果 作 初 步 


分 析 . 
2. 练习 用 非 线 性 方程 和 方程 组 建立 实际 问题 的 模型 并 进行 求解 
实验 内 容 


1. 分 别 用 fzero 和 fsolve 程序 求 方程 sinz 一 二 /2 = 0 的 所 有 根 , 准 确 到 10-", 取 不 
同 的 初 值 计算 ,输出 初 值 、. 根 的 近似 值 和 和 迭代 次 数 ,分 析 不 同根 的 收敛 域 ;自己 构造 某 个 迭 
代 公 式 ( 如 z = (2sinz) 等) 用 和 迭代 法 求解 ,并 自己 编写 牛顿 法 的 程序 进行 求解 和 比较 . 

2. 对 有 一 2,3,4,5,6， 分 别 求 一 个 3 阶 实 方 阵 4, 使 得 A* 二 [1,2,3;4,5,6;7,8,9]. 

3. (1) 小 张 夫妇 以 按揭 方式 贷款 买 了 1 套 价 值 20 万 元 的 房子 ,首付 了 5 万 元 ,每 月 
还 款 1000 元 ,15 年 还 清 . 问 贷款 利率 是 多 少 ? 

(2) 某 人 和 欲 贷款 50 万 元 购房 ,他 咨询 了 两 家 银行 ,第 一 家 银行 开 出 的 条 件 是 每 月 还 
4500 元 ,15 年 还 清 ; 第 二 家 银行 开 出 的 条 件 是 每 年 还 45000 元 ,20 年 还 清 . 从 利率 方面 看 ， 


6.5 实验 练习 


. 哪 家 银行 较 优 惠 ( 简 单 地 假设 年 利率 = 月 利率 X12)? 

4. 水 槽 由 半圆 柱 体 水 平 放置 而 成 ,如 图 6. 11 所 示 . 圆柱 体 长 工 , 半径 r, 当 给 定 水 楼 
内 盛 水 的 体积 V 后 ,要求 计算 从 水 槽 边 没 到 水 面 的 距离 
Z. 今 已 知 荆 = 一 25. 4m，r 一 2m， 求 Y 分 别 为 10,50， 
100ms3 的 二 . 

5. 由 汽缸 控制 关闭 的 门 ,关闭 状态 的 示意 图 如 
-图 6.12(0a). 门 宽 a, 门 枢 在 五 处 ,与 互相 距 为 处 有 一 
门 销 ,通过 活塞 与 圆柱 形 的 汽缸 相连 ,活塞 半径 ~, 汽 缸 图 6.11 第 4 题 图 
长 0， 汽缸 内 气体 的 压强 为 po. 当 用 力 下 推 门 ,使 门 打 


开 一 个 角度 a 时 (示意 图 如 图 6. 12(b)) ,活塞 下 降 的 距离 为 c, 门 销 与 五 的 水 平 上 距离 5 保 


持 不 变 , 于 是 汽缸 内 的 气体 被 压缩 ,对 活塞 的 压强 增加 .已 知 在 绝热 条 件 下 ,气体 的 压强 p 
和 体积 V 满足 pV? 二 c, 其 中 y 是 绝热 系数 ,c 是 常数 . 试 利 用 开门 力矩 和 作用 在 活塞 上 的 
力矩 相 平衡 的 关系 (对 门 枢 而 言 ), 求 在 一 定 的 力 下 作用 下 , 门 打 开 的 角度 . 设 < 一 0. 8m， 
b=0.25m, r=0.04m, l=0.5m, po=10'N/m’:, y=1.4, F=25N. 


(a) 门 的 关闭 状态 (b) 门 的 开启 状态 
图 6.12 


6. 给 定 4 种 物质 对 应 的 参数 ai ,6;,c; 和 交互 作用 和 矩阵 Q 如 下 : 
wa 一 18. 607， aa 一 15.841， as 一 20.443， a:=19.293; 
六 一 2643.31， b=2755.64, 6;=4628.96, b=4117.07; 
ci 一 239. 73， cz 一 219. 16， c3 =252. 64， c=227.44; 
Q= [1.0 0.192 2.169 1.611 
0.316 1.0 0.477 0.524 
0.377 0.360 1.0 0. 296 
0.524 0.282 2.065 1.0] 
在 压强 p 二 760mmHg 下 ,为 了 形成 均 相 共 沸 混合 物 ,温度 和 组 分 分 别 是 多 少 ? 请 尽量 找 
出 所 有 可 能 的 解 . 
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7. 用 迭代 公式 ze 一 are exp( 一 和 zx) 计算 序列 {zi) ,分 析 其 收敛 性 ,其 中 a 分 别 取 


5, 11, 15; 6( 之 0) 任 意 , 初 值 ze 一 1. 观察 是 否 有 混沌 现象 出 现 , 并 找 出 前 几 个 分 岔 点 , 观 
察 分 贫 点 的 极限 趋势 是 否 符合 Feigenbaum 常数 揭示 的 规律 . 


8. 假设 商品 在 i 时 期 的 市 场 价格 为 p(t), 需求 函数 为 DC(p(i))==c 一 dp(1) (cd 二 


0). 而 生产 方 的 期 望 价格 为 q(2) ,供应 函数 为 SCq(z)). 当 供销 平衡 时 SC(q(2)) 二 DCp(2)). 


若 期 望 价格 与 市 场 价格 不 符 ,商品 市 场 不 均衡 ,生产 方 :十 1 时 期 的 期 望 价格 将 会 调 


整 ,方式 为 q(t 十 1) 一 gq(21)= r[p(t) 一 q(t)](0<r<1), 以 p(t)=[c—-D(p())]/ d=[e 
一 S(q(z))j/ d 代入 ,得 到 关于 q(z) 的 递 推 方程 . 设 SC(x) 二 arctan(jyx),p 二 4.8,d 二 0. 25， 
r 一 0. 3, 以 c 为 可 变 参 数 ,讨论 期 望 价格 gq(z) 的 变化 规律 ,是 否 有 混沌 现象 出 现 ,并 找 出 前 
几 个 分 贫 点 ,观察 分 岔 点 的 极限 趋势 是 否 符合 Feigenbaum 常数 揭示 的 规律 . 
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无 约束 优化 


在 工程 技术 经济 管 理 .科学 研究 和 日 常生 活 等 诸多 领域 中 ,人 们 经 常 遇 到 的 一 类 决 
策 问题 是 : 在 一 系列 客观 或 主观 限制 条 件 下 ,寻求 使 所 关注 的 某 个 或 多 个 指标 达到 最 大 
(或 最 小 ) 的 决策 . 例如 ,结构 设计 要 在 满足 强度 要 求 条 件 下 选择 材料 的 尺寸 ,使 其 总 重量 
最 轻 ; 资 源 分 配 要 在 有 限 资源 约束 下 制定 各 用 户 的 分 配 数量 ,使 资源 产生 的 总 效益 最 大 ; 
运输 方案 要 在 满足 物资 需求 和 装载 条 件 下 安排 从 各 供应 点 到 各 需求 点 的 运 量 和 路 线 ,使 
运输 总 费用 最 低 ;生产 计划 要 按照 产品 工艺 流程 和 顾客 需求 ,制定 原料 、 零 件 、 部 件 等 订 
购 ,投产 的 日 程 和 数量 ,尽量 降低 成 本 使 利润 最 高 . 

上 述 这 种 决策 问题 通常 称 为 优化 问题 . 人 们 解决 这 些 优 化 问题 的 手段 大 致 有 以 下 
几 种 : 

1. 依赖 过 去 的 经 验 判断 面临 的 问题 . 这 似乎 切实 可 行 ,并 且 没有 太 大 的 风险 ,但 是 其 
处 理 过 程 会 融入 决策 者 太 多 的 主观 因素 ,常常 难以 客观 地 加 以 描述 ,从 而 无 法 确认 结果 的 
最 优 性 ， 

2. 做 大 量 的 试验 反复 比较 . 这 固然 比较 真实 可 靠 ,但 是 常 要 花费 太 多 的 资金 和 人 力 ， 
而 且 得 到 的 最 优 结果 基本 上 离 不 开 开 始 设计 的 试验 范围 

3. 用 数学 建 模 的 方法 建立 数学 规划 模型 求解 最 优 决 策 . 虽然 由 于 建 模 时 要 作 适 当 的 
简化 ,可 能 使 得 结果 不 一 定 完全 可 行 或 达到 实际 上 的 最 优 ,但 是 它 基于 客观 规律 和 数据 ， 
又 不 需要 多 大 的 费用 ,具有 前 两 种 手段 无 可 比拟 的 优点 . 如 果 在 此 基础 上 再 辅 之 以 适当 的 
经 验 和 试验 ,就 可 以 期 望 得 到 实际 问题 的 一 个 比较 圆满 的 回答 ,是 解决 这 种 问题 的 最 有 
效 .最 常用 的 方法 之 一 . 在 决策 科学 化 .定量 化 的 呼声 日 益 高 涨 的 今天 ,用 数学 建 模 方法 求 
解 优化 问题 ,无 疑 是 符合 时 代 潮 流 和 形势 发 展 需要 的 . 

数学 规划 模型 一 般 有 三 个 要 素 : 一 是 决策 变量 ,通常 是 该 问题 要 求解 的 那些 未 知 量 ， 
不 妨 用 nn 维 向 量 x 二 (xi zy,…,z)7 表示 ;二 是 目标 函数 ,通常 是 该 问题 要 优化 (最 小 或 
最 大 ) 的 那个 目标 的 数学 表达 式 , 它 是 决策 变量 x 的 函数 ,这 里 抽象 地 记 作 f(x); 三 是 约 
束 条 件 ,由 该 问题 对 决策 变量 的 限制 条 件 给 出 , 即 x 允许 取 值 的 范围 xxEQ,9 称 可 行 域 ， 
常用 一 组 关于 x 的 不 等 式 ( 也 可 以 有 等 式 )g;(x) 志 0(i 二 1,2,…,m) 来 界定 . 一 般 地 ,这 类 
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模型 可 表述 成 如 下 形式 : 
opt z= f(x) (1) 
St gr) C0, i= l,m. (2) 
这 里 opt (optimize) 是 最 优化 的 意思 ,可 以 是 求 极 小 min (minimize) 或 求 极 大 
max(maximize) ;s. t. (subject to) 是 “ 受 约束 于 ”的 意思 . 满足 (2) 式 的 解 x 称 为 可 行 解 , 同 
时 满足 (1) 式 ,(2) 式 的 解 x 称 为 最 优 解 . 1 

你 可 能 已 经 注意 到 ,模型 (1),(2) 大 致 上 是 微 积 分 中 多 元 函数 的 条 件 极 值 问 题 . 当 约 
束 条 件 (2) 比 较 简 单 ( 如 全 为 等 式 ) 时 ,多 元 微 积分 中 介绍 过 求解 析 解 的 基本 原理 和 方法 ， 
即 令 目标 函数 (对 等 式 约束 需要 加 上 与 其 对 应 的 拉 格 朗 日 乘 子 的 乘积 项 ) 的 偏 导数 为 零 ， 
求 出 驻 点 后 再 比较 驻 点 上 的 函数 值 . 不 幸 的 是 ,大 多 数 实际 问题 归结 出 的 上 述 形式 的 模型 
很 难 用 这 种 方法 求解 ,因为 第 一 ,解析 方法 只 能 处 理 目标 函数 f 和 约束 条 件 &: 比 较 简 
单 ,并 且 决 策 变量 个 数 ”约束 条 件 个 数 m 比较 小 的 情形 , 当 f, 8g; 稍微 复杂 时 通常 至 少 需 
要 求解 比较 复杂 的 非 线 性 方程 (组 ) ,很 难得 到 解析 解 ; 第 二 , 当 最 优 解 在 可 行 域 的 边界 上 
取得 时 (不 少 实际 问题 正 是 如 此 ) ;就 不 能 用 原 有 的 求 条件 极 值 的 方法 求解 . 所 以 对 于 优化 
问题 的 这 类 模型 必须 寻求 有 效 的 数值 解法 . 

优化 问题 可 以 从 不 同 的 角度 进行 分 类 .由 (1) 式 ,2) 式 组 成 的 模型 称 为 约束 优化 , 若 
只 有 (1) 式 就 是 无 约束 优化 . 一 般 说 来 ,实际 生活 中 的 优化 问题 总 是 有 约束 的 ,但 是 如 果 最 
优 解 不 是 在 可 行 域 的 边界 上 ,而 是 在 它 的 内 部 ,那么 就 可 以 用 无 约束 优化 来 比较 简单 地 处 
理 . 男 外 ,在 理论 和 算法 上 ,无 约束 优化 也 是 约束 优化 的 基础 . 

当 模 型 (1), (2) 中 决策 变量 x 的 所 有 分 量 zx; (i 二 1,…，, 7n) 均 为 实数 , 且 f,g; (i 二 1， 
2,… ,m) 都 是 线性 函数 时 , 称 为 线性 规划 . 若 f ,gi 至少 有 一 个 韭 线性 函数 , 则 称 为 非 线性 
规划 . 若 x 至 少 有 一 个 分 量 只 取 整 数 , 则 称 为 整数 规划 . 线性 规划 和 非 线 性 规划 是 连续 规 
划 ,而 整数 规划 是 离散 优化 { 组 合 优化 ) ,它们 统称 为 数学 规划 . 

本 书包 括 三 个 数学 规划 方面 的 实验 : 无 约束 优化 ,线性 规划 与 非 线 性 规划 ,整数 规 
划 . 本 实验 讨论 无 约束 优化 问题 的 求解 ,7. 1 节 给 出 几 个 实际 问题 并 建立 数学 模型 ,7. 2 节 
介绍 求解 无 约束 优化 的 基本 原理 和 方法 ,7. 3 节 是 MATLAB 优化 工具 箱 的 使 用 及 7. 1 
节 问 题 的 求解 ,7.4 节 布 置 实 验 练习 . ; 


7.1 实例 及 其 数学 模型 
7.1.1 产销 量 的 最 佳 安排 


问题 “ 某 厂 生产 的 某 种 产品 有 甲乙 两 个 型 号 ,工厂 计划 人 员 希 望 确 定 两 个 型 号 各 自 
的 产量 ,使 总 的 利润 最 大 . 为 简单 起 见 ,下 面 只 在 产销 平衡 的 情况 下 进行 讨论 , 即 假设 该 工 . 


7.1 实例 及 其 数学 模型 


厂 的 产品 都 能 售 出 ,并 等 于 市 场 上 的 销量 . 

工厂 的 利润 既 取 决 于 销量 和 ( 单 件 ) 价 格 ,也 依赖 于 产量 和 ( 单 件 ) 成 本 . 按照 市 场 经 济 
规律 , 甲 的 价格 会 随 其 销量 的 增长 而 降低 ,同时 乙 的 销量 的 增长 也 会 使 甲 的 价格 有 一 定 的 
下 降 ; 乙 的 价格 遵循 同样 的 规律 . 而 甲 . 乙 的 成 本 都 随 其 各 自 产 量 的 增长 而 降低 , 且 各 有 一 
渐进 值 . 

模型 ” 记 甲 . 乙 两 个 型 号 的 产 ( 销 ) 量 分 别 为 :和 zs, 价格 分 别 为 pl 和 p; ,成 本 分 别 
-为 9 和 9 简单 地 假设 每 个 型 号 的 价格 与 两 个 型 号 的 销量 成 线性 关系 , 即 户 一 所 一 au za 一 
Qiz Za yj 加 一 0 一 aolZI 一 02222(0 Qil > ,bz ;Qaz1 az 之 0), 并 且 合 理 地 设 a 六 a1z ,azz 户 azl 
(为 什么 ?). 简单 地 假设 每 个 型 号 的 成 本 与 本 型 号 的 产量 服从 负 指 数 关系 , 且 有 渐 近 值 , 即 
@ 一 me 和 1 十 0 qz 二 rze *% 如 十 cs 《riyA1yc1syr29Azs0z 记 0). 于 是 总 利润 为 

2z(ZlyZ2) (pi — qi)zi Tt (ps ~ gq2)x2 


一 (和 —anni—awvr — ne —c)x 
十 ( — Qazi — AQz2 Tz — roe tT — Cz) re. (3) 
间 题 化 为 求解 maxz(zi ,zz )， 

这 里 对 两 个 型 号 的 产量 没有 任何 限制 ,模型 (3) 是 一 个 无 约束 优化 问题 . 容易 看 出 , 它 
实际 上 是 大 家 学 过 的 求 二 元 函数 的 极 值 ,可 以 计算 偏 导数 , 令 其 等 于 零 来 求解 . 读者 不 妨 
这 样 做 一 下 ,你 会 发 现 要 解 非 线 性 方程 组 ,一 般 只 能 求 数值 解 ,尤其 当 变量 较 多 时 需要 研 
究 更 有 效 的 算法 . 

一 般 说 来 ,实际 问题 中 对 产量 总 是 有 限制 条 件 的 ,如 产量 不 能 为 负数 ,又 如 由 于 生产 
能 力 的 限制 ,两 个 型 号 的 产量 之 和 不 能 超过 某 个 给 定 值 等 ,加 上 这 些 条 件 就 变 成 约束 优化 
问题 . 但 是 如 果 最 优 解 不 正好 在 这 些 条 件 的 边界 上 ,那么 就 仍然 可 以 作为 无 约束 优化 问题 
求解 . 


7.1.2 飞机 的 精确 定位 8 
问题 飞机 在 飞行 过 程 中 ,能 够 收 到 地 面 上 各 个 监控 人 台 发 来 的 关于 飞机 当前 位 置 的 


信息 ,根据 这 些 信息 可 以 比较 精确 地 确定 飞机 的 位 置 . 如 图 7. 1 所 示 ,VOR 是 高 频 多 向 导 


航 设备 的 英文 缩写 , 它 能 够 得 到 飞机 与 该 设备 连 线 的 角度 信息 ;DME 是 距离 测量 装置 的 
英文 缩写 , 它 能 够 得 到 飞机 与 该 设备 的 距离 信息 . 图 中 飞机 接收 到 来 自 3 个 VOR 给 出 的 
角度 和 1 个 DME 给 出 的 距离 (括号 内 是 测量 误差 限 ), 并 已 知 这 4 种 设备 的 xz,y 坐标 ( 假 
设 飞 机 和 这 些 设备 在 同一 平面 上 ). 如 何 根据 这 些 信息 精确 地 确定 当前 飞机 的 位 置 ? 

模型 ” 记 4 种 设备 VOR1,VOR2,VOR3,DME 的 坐标 为 (zy)( 单 位 : km) ,一 1， 
2,3,4;VOR1,VOR2,VOR3 测量 得 到 的 角度 为 9( 按 照 航空 飞行 管理 的 惯例 ,该 角度 是 
从 北 开始 , 沿 顺 时 针 方向 的 角度 , 取 值 在 0 一 360" 之 间 ) ,角度 的 误差 限 为 oi;(i 二 1,2,3); 


> 
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图 7.1 飞机 与 监控 台 


DME 测量 得 到 的 距离 为 w (km) ,距离 的 误差 限 为 o. 设 飞机 当前 位 置 的 坐标 为 (zx, yy)， 
则 问题 就 是 在 表 7. 1 的 已 知 数 据 下 计算 (zx,y): 


表 7.1 


原始 的 6.( 或 d,) Oi 转换 后 的 8;/rad 
VORI 746 1393 | 161.2° 0. 8°C0. 0140rad) 2. 8135 
VOR? 629 375 45.1° | 0.6°C0.0105rad) 0.7871 
VOR3 1571 259 | 309.0° 1.3"(0.0227rad) |  —0.8901 
DME 155 987 d, =864. 3km 2. Okm 


车 点 (zi,y:) 和 点 (zx,y) 的 连 线 与 x 轴 的 夹 角 记 为 a:( 以 x 轴 正 向 为 基准 , 逆 时 针 方 向 
夹 角 为 正 , 顺 时 针 方 向 夹 角 为 负 ) ,我 们 熟悉 的 关系 是 w 一 arctan( > 一 当 ) ,其 中 arctan 是 


9 

取 值 在 区 间 ( 一 x*/2,xr/2) 上 的 反正 切 函 数 . 但 是 图 中 角度 6; 的 测量 方式 与 此 不 同 , 它 是 点 
(zi,yi) 和 点 (z,y) 的 连 线 与 y 轴 的 夹 角 (以 y 轴 正 向 为 基准 , 顺 时 针 方 向 夹 角 为 正 ,而 不 
考虑 逆 时 针 方向 的 夹 角 ) ,于 是 6. 一 arctan( 了 一) .但 是 ,这 样 表示 的 0 仍然 只 有 当 6, 位 
于 区 间 [0,x/2) 时 才 是 成 立 的 . 实际 上 ,应 该 注意 到 9; 除了 与 点 (z Tioy yi) 的 横 纵 坐 
标的 比值 有 关外 ,还 与 这 个 点 在 4 个 象限 中 的 哪个 象限 有 关 . 

为 了 解决 这 个 问题 ,我 们 借用 MATLAB 库 函 数 中 的 4 象限 反正 切 函 数 arctan2(6， 
a) , 它 根 据点 (ae, 2) 在 4 个 象限 的 位 置 ,计算 原点 与 点 (a, 6) 的 连 线 和 xz 轴 正 向 的 夹 角 ( 逆 
时 针 方 向 夹 角 为 正 ) , 取 值 为 区 间 ( 一 x,x], 正 好 相当 于 原点 与 点 (06, a) 的 连 线 和 y 轴 正 向 


的 夹 角 ( 顺 时 针 方 向 夹 角 为 正 ). 
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根据 以 上 分 析 ,车 将 原始 的 b(i 王 1,2,3) 转换 成 弧度 ,并 使 之 满足 一 r<b 委 r( 即 当 
弧度 大 于 x 时 , 减 去 2x, 仍 记 为 和 4, 见 上 表 中 最 后 一 列 ) , 则 可 以 得 到 
0; = arctan2(z—Zziy~y;), 1= 1,2,3. (4) 
对 DME 测量 得 到 的 距离 ,有 
= V(rz— x) Ty yy. (5) 
由 (4) 式 ,(5) 式 共 4 个 等 式 确定 飞机 的 坐标 z,y, 是 求解 超 定 ( 非 线性 ) 方 程 组 ,如 果 
直接 按照 5.4 节 的 类 似 方 法 ,在 最 小 二 乘 准则 下 使 计算 值 与 测量 值 的 误差 平方 和 最 小 , 则 
需要 求解 


minJ (zx,y) = DCarctan2(z -ay 一 y) —0F +[d— Vr— rz) ty— yl}. 


但 是 注意 到 问题 中 角度 和 和 距离 的 单位 是 不 一 致 的 ,并 且 4 种 设备 测量 的 精度 (误差 限 ) 不 
同 , 因 此 这 4 个 误差 平方 和 不 应 该 同等 对 待 ,而 用 各 自 的 误差 限 o; 对 它们 进行 无 量 纲 化 
地 加 权 处 理 是 合理 的 , 即 求解 如 下 的 无 约束 优化 问题 : 

Ce = (各 一 AE Cy yy 


i=1 Oi G4 


minFE(z,y) = 


(6) 
由 于 目标 函数 是 平方 和 的 形式 ,因此 这 也 是 一 个 非 线性 最 小 二 乘 拟 合 问题 ， 


7.2 无 约束 优化 的 基本 方法 


本 节 介绍 求解 无 约束 优化 模型 的 基本 原理 和 方法 . 假设 目标 为 最 小 化 (最 大 化 问题 

类 似 ) ,无 约束 非 线性 规划 问题 为 

minf(x)，Y 一 (zz)T ER'. (7) 
实际 上 这 是 一 个 多 元 函数 无 条 件 极 值 问题 . 应 该 注意 的 是 , 极 值 问题 的 解 ( 即 极 值 点 ) 通 党 
都 是 局 部 最 优 解 ,寻找 全 局 最 优 解 需要 对 局 部 最 优 解 进行 比较 以 后 得 到 (如 果 能 够 求 出 所 
有 局 部 最 优 解 的 话 ). 以 下 所 谓 最 优 解 均 指 局 部 最 优 解 . 

将 (x) 的 梯度 记 作 了 f(x) 二 (Cf,…,f. )T(n 维 向 量 ) ,其 中 广 一 i=, a) 
f(x) 的 黑 塞 (Hessian) 和 矩阵 记 作 V f/f 二 (ff )(nXn 和 矩阵 , 简 记 为 吾 阵 , 它 实 际 上 就 是 梯 
度 函 数 的 雅 可 比 年 阵 ), 其 中 /一 F 关 -C1j 一 1,2,…,n). 回顾 多 元 西数 极 值 问题 最 优 
解 的 条 件 ,我 们 知道 + 二 x" 是 最 优 解 的 必要 条 件 为 

vf(x’")=0 (8) 
充分 条 件 为 
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sy (9) 
7.2.1 下 降 法 的 基本 思想 


求解 优化 问题 的 基本 思想 是 用 迭代 法 搜索 最 优 解 . 在 迭代 的 第 步 , 即 对 维 空间 KR 
中 的 一 点 x* ,确定 一 个 搜索 方向 和 一 个 步 长 ,使 沿 此 方向 、 按 此 步 长 走 一 步 到 达 下 一 点 
时 ,函数 值 fx) 下降 . 这 种 方法 称 为 下 降 法 (或 形象 地 称 为 下 山 法 ) ,其 基本 步骤 为 : 

1. 选 初始 解 x ; 

2. 对 于 第 次 迭代 解 x* ,确定 搜索 方向 dE R' ,并 在 此 方向 确定 搜索 步 长 ER , 令 
XI 一 入 十 ost 使 f(x:11)< 之 f(x*); 

3. 车 x*+! 符 合 给 定 的 迭代 终止 原则 ,停止 兴 代 ,最 优 解 x* = 二 x**! ;否则 , 转 2. 

不 同 的 算法 在 于 d* ,a* 的 选择 不 同 ,目的 是 使 f 下 降 更 快 .下面 分 别 讨论 确定 搜索 方 
向 和 搜索 步 长 的 方法 . 


7.2.2 搜索 方向 的 选择 
暂时 不 考虑 搜索 步 长 ,不 妨 视 为 a 二 1. 搜索 方向 必 应 为 f 的 下 降 方 向 ,有 以 下 几 种 
选择 方法 . 
1. 最 速 下 降 法 (梯度 法 ) 
将 fCx1) 在 x* 点 作 泰 勒 展开 ,只 保留 一 阶 项 ,有 


fx) = fx ad) = fx)+ vf Cx) dt. (10) 

显然 ,只 要 满足 
Vf/T(x') dt < 0, . (11) 
d 就 是 下 降 方向 . 满足 (11) 式 的 下 降 方向 有 无穷 多 个 ,其 中 使 |9fT(x*)d* | 达到 最 大 的 是 
d* =— Vf(x:), (12) 


称 为 最 速 下 降 方向 . 因为 梯度 方向 是 函数 增长 最 快 的 方向 ,所 以 毫 不 奇怪 , 负 梯 度 方向 就 
是 最 速 下 降 方向 . 对 应 的 方法 称 最 速 下 降 法 ,或 梯度 法 ,其 迭代 公式 为 ( 设 a* 二 1) 
Xi = x — VfCx’). (13) 
计算 表明 ,用 梯度 法 在 迭代 的 初始 阶段 f 下 降 较 快 ,但 在 接近 最 优 解 x" 时 下 降 变 慢 ( 为 什 
人 么 ?). | 
2. 牛顿 法 
根据 最 优 和 解 的 必要 条 件 ,理论 上 只 需求 解 方程 组 YACxz) 一 0 即 可 :我 们 自然 想到 可 以 
利用 实验 6 中 介绍 的 牛顿 法 , 将 VAC(x) 看 成 那里 的 F(x) , 则 和 后 顿 欠 代 公 式 ( 实 验 6 中 (28) 
式 ) 变 成 
区 CT1) = x a [LY 2 Cx Vf(x'® )， . (14) 
该 方法 仍然 称 为 牛顿 法 . 此 时 搜索 步 长 a* 二 1 ,搜索 方向 为 
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d* =— (Vf(x))! Vf(x’), (15) 
称 为 牛顿 方向 . 当 黑 塞 矩 阵 Y :f(x*) 正 定时 ,其 逆 答 阵 仍 正定 ,所 以 (15) 式 的 dt 满足 
(11) 式 , 即 牛顿 方向 是 下 降 方向 . 
牛顿 方向 dt 满足 
VzACz)de 一 一 VC)， (16) 
该 方程 组 称 为 牛顿 方程 . 
牛顿 法 的 优点 是 在 接近 最 优 解 时 具有 2 阶 收 义 性 ( 阶 的 定义 见 实验 6) ,缺点 是 当 


Y “f(x*) 病 态 时 不 利于 方程 (16) 的 求解 , 且 当 Y “f(x*) 不 正定 时 d* 可 能 不 是 下 降 方 向 . 


另外 ,牛顿 法 也 只 具有 局 部 收 化 性 , 即 仅 当初 始点 在 最 优 解 x" 的 某 一 邻 域 内 时 x* 才 收 敏 
于 x".， 
3. 拟 牛 顿 法 
牛顿 法 中 黑 塞 矩 阵 V :f(x*) 不 仅 计算 复杂 ,而 且 会 出 现 病态 、 不 正定 等 情况 .为 克服 
这 些 缺 点 ,同时 保持 较 快 收敛 的 优点 ,可 以 考虑 采用 实验 6 介绍 的 拟 牛 顿 法 的 思想 , 即 利 
用 第 & 和 & 十 1 步 得 到 的 x*,x*t!1 ,YA(x*)，,Vf(x**!1), 构 造 一 个 正定 和 矩阵 G 扩 :近似 代替 
V ?f(x*11) ,或 直接 构造 H*"1 近 似 代 替 (V ?fCx**!))7, 为 此 ,将 (15) 式 ,(16) 式 改 为 
. Gq =— 9f(xt), dh 一 一 Be VCxzeh )， (17) 
从 而 得 到 下 降 方 向 4**. 
为 利用 革 ,x*f ,7f(x*) VCztrI) 构 造 Getl ,Ht!, 记 
Ax: = x"li—xt, AfF= VfCxT!) — VF). (18) 
因为 Vf《xt!1) Axt 人 Af (为 什么 ?), 要 用 G 代替 VC 或 下 代替 
(V ?flxtt!1))71, 就 必须 有 
GiAx: = Af*, Ax: = HIAf:, (19) 
该 条 件 称 为 拟 牛 顿 条 件 .根据 这 个 条 件 通常 采用 迭代 法 计算 G**! ,HY!, 称 拟 牛 顿 法 . 几 
个 著名 的 和 迭代 公式 为 BFGS (Broyden-Fletcher-Goldfarb-Shanno) 公式 , DFP (Davidon- 
Fletcher-Powell) 公 式 ,GM(Gill-Murray) 公 式 , 具 体 的 构造 方法 可 参看 其 他 有 关 书 籍 . 


7.2.3 搜索 步 长 的 确定 一 一 线性 搜索 
搜索 方向 必 确定 后 , 求 步 长 et 实际 上 是 一 个 一 维 优化 问题 ， 


minf (x + ad’*), (20) 
称 一 维 搜索 (或 线性 搜索 ) ,显然 其 精确 解 应 满足 
(d*)TVf(x: +ad*)= 0. (21) 


当 /复杂 入 较 大 时 求解 (21) 式 的 计算 量 很 大 . 一 维 优化 的 近似 方法 很 多 ,如 二 分 
法 .黄金 分 割 法 ( 即 0.618 法 )、Fibonacci 法 ,以 及 求 函 数 极 值 的 牛顿 切线 法 和 制 线 法 . 实 
际 计算 中 更 为 有 效 的 是 插值 方法 ,如 对 A(xe 十 cd 采用 二 次 插值 函数 . 
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gla) 一 ao 十 au 十 c， (22) 
其 中 a,b,c 可 由 a=0 的 函数 值 和 导数 值 9C0) 二 /Cx*),g (0) 二 VfCx*) Td ,以 及 另 一 点 的 
函数 值 9(a) 二 f(x 十 ad*) 确 定 ,而 a 的 最 优 值 取 使 9Ca) 达 到 最 小 的 ow 一 一 6/2a. 如 果 采 
用 三 次 插值 方法 ,就 需要 增加 计算 另 一 点 的 导数 值 . 还 可 以 用 混合 二 次 三 次 插值 方法 ,有 
兴趣 的 读者 可 参看 MATLAB 的 帮助 信息 或 其 他 书籍 . 


7.2.4 非 线 性 最 小 二 乘 拟 合 


有 一 组 数据 (ti, yi) (i 二 1,…,n), 要 拟 合 一 个 已 知 函 数 y 二 f(x, br 一 (ziyzz，…， 
Xm)《m 二 nn) ,x 为 待定 系数 , 记 误 差 

ri(x) = fxyti)— ys rx) = rx) ser, (Xx))T. (23) 

拟 合 误差 定义 为 r(x) 的 平方 和 ,于 是 问题 表示 为 如 下 的 优化 模型 (为 推导 时 记号 上 的 方 
便 , 目 标 用 平方 和 的 一 半 来 表示 ): 


minR, R= Fr r(x) 一 FL) — yy. (24) 
x i=] 


当 f 对 x( 的 某 些 分 量 ) 是 非 线性 函数 时 , 称 非 线 性 最 小 二 乘 拟 合 . 实际 上 这 是 一 个 无 
约束 非 线性 规划 ,可 以 用 前 面 介绍 的 方法 求解 ,但 由 于 该 问题 中 目标 函数 是 r(x) 的 二 次 
函数 这 一 特殊 性 ,可 以 构造 一 些 相 对 简单 的 算法 . 

记 r(x) 的 雅 可 比 阵 为 


J = ( 严 ) ， (25) 


jnXm 


则 
VR= Trx), VR=JTIx) tS, S$S= Pri(x) Vri(x). (26) 
i=1 


92 f (x,t;) ) (上 
OXIT1 /fmnxm 


如 果 用 牛顿 法 ,就 要 计算 CVeR)-: ,而 $ 中 二 阶 导 数 和 矩阵 Vr (x) 一 ( 
1 二 1,2,…,m) 的 计算 量 很 大 . 

为 了 简化 计算 ,我们 注意 到 : 如 果 f 对 x 是 线性 的 ,二 阶 导数 Y ?r(x) 为 零 . 所 以 在 做 
非 线性 最 小 二 乘 时 ,人 们 探讨 能 否 忽略 或 近似 $ 的 问题 . 

1. 高 斯 -牛顿 法 

如 果 忽 略 8 后 用 牛顿 法 ,将 (26) 式 代 和 牛顿 方程 (16) ,下 降 方向 必 由 

J xTx Nd =— J (x )r(x’) (27) 

解 出 , 称 高 斯 -牛顿 法 (GN 法 ). 这 种 方法 的 收敛 速度 依赖 于 f 对 x 的 线性 程度 ,及 误差 
r(x) 的 大 小 ,适用 于 f 对 x 近似 于 线性 及 r 较 小 的 情况 . 当 f 对 x 高 度 非 线性 或 r 很 大 
时 ,高 斯 -牛顿 法 可 能 不 收敛 . 
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2. LM 方法 
在 高 斯 -牛顿 法 中 J "J 总 是 半 正 定 的 ,但 会 出 现 病态 ,改进 方法 是 将 (27) 式 修正 为 


CJ Cx)T Cx) a Td =— J (x )r(x’), (28) 


其 中 工 是 单位 阵 ,a* >0 是 在 每 次 迭代 中 修正 的 参数 . 不 难看 出 , 当 at 很 小 时 (28) 式 接近 
高 斯 -牛顿 法 ,而 当 at 很 大 时 d* 接近 于 负 梯 度 方向 ,所 以 每 次 迭代 的 下 降 方向 在 牛顿 广 
向 与 负 梯 度 方向 之 间 . 这 个 方法 以 提出 者 的 名 字 命 名 为 Levenbery-Marquardt 法 (LM 
法 ). 

此 外 还 可 以 注意 到 , 非 线性 最 小 二 乘 拟 合 也 可 以 用 来 解 非 线性 超 定 方程 组 ,只 需要 将 
方程 组 看 成 这 里 的 r(x) =0, 以 各 个 rx) 的 平方 和 (的 一 半 ) 作 为 目标 函数 即 可 . 
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7.3.1 MATLAB 优化 工具 箱 主 要 功能 


在 MATLAB 中 ,为 求解 优化 问题 开发 了 专门 的 优化 工具 箱 (optimization toolbox)， 
该 工具 箱 的 程序 (函数 m 文件 ) 位 于 目录 toolbox\optim 下 . 本 书 介绍 的 是 MATLAB 


6. 5. 1 版 本 中 配置 的 优化 工具 箱 的 功能 和 使 用 方法 ,其 主要 功能 简要 归纳 在 图 7.2 中 , 较 


详细 的 介绍 如 表 7. 2 所 示 ， 


连续 优化 离散 优化 


无 约束 优化 


整数 规划 (bintprog ) 


非 线性 极 小 非 光滑 (不 可 | | 线性 规划 二 次 规划 || 网 络 优化 
fminunc 微 ) 优 化 linprog quadprog 《 暂 缺 ) 
fminsearch fminsearch 


| 下 二 二 =: 


ee 


非 线 性 非 线性 全 局 优化 | | 非 线性 规划 | | 约束 线性 | | 上 下 界 约束 
方程 (组 )| | 最 小 二 乘 ( 暂 缺 ) fmincon 最 小 二 乘 | | fminbnd 
fzero jsqnonlin fminimax lsqnonneg | | fmincon 
fsolve lsqcurvefit fgoalattain Isglin lsqnonjin 

| | | fseminf | lsqcurvefit | 


图 7.2 MATLAB 优化 工具 箱 的 主要 功能 示意 图 
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表 7.2 MATLAB 优化 工具 箱 的 主要 功能 与 基本 用 法 


问题 模 型 基本 命令 的 用 法 基本 的 . m 文件 
方程 求 根 flr)=0, xER x=fzero( @f,x0) function y=f(x) 
方程 组 求解 F(x)=0, xE R" x= fsolve( @F',x0) function y= F(x) 
有 界 单 变 量 优化 人 x=fminbnd( @f, v1, v2) function y=f(x) 
| IIE, 
无 约束 极 小 min f(x) xER" x= fminunc( @f, x0) function y= f(x) 
( 非 线性 规划 ) Y x=fminsearch( @f, x0) function y= f(x) 
| min f(x),xER" 
s.t. Ci(x)&0 
约束 极 小 C(x)=0 x= fmincon (@f, x0, A1, |function y= f(x) 
( 非 线 性 规划 ) Alx<h b1,A2,b2,v1,v2,.@C) function [C1,C2] = C(x) 
A,x=b, 
Di 和 
min cix 
_ s.t. Alx<hb x= linprog (c, Al, b1, A2, 
扣 
线性 规划 A,x=b, b2,v]1,v2,x0) 
< V2 
min x Hx/2+ cx 
s.t. Alx<b, x= quadprog (H,c, Al, b1, 
Ne 
一 次 规划 Asx=b, A2,b2,v]1,v2,x0) 
VIX Us 
minmaxF (x) 
s.t. C(x)<0 | 
C(x)=0 x= fminimax (@F, x0, Al, |function y= F(x) 
极 小 极 大 A rh |b1,A2,b2,v1,v2, @O) functionLC1,C2]= C(x) 
A,x=b, 
VCSXSv; 


非 负 线性 最 小 二 乘 


是 到 Hcx—al| 


s.t. Xx 宇 0 


x= isqnonneg(C,d) 


约束 线性 最 小 二 乘 


min 广 | Cx 一 4 

Ss.t，41x< 扫 及 
A,x=b, 
v1rIRC 


2 


s 


x= lsqlin(C, d, A1, bi, A2, 
b2 ,v1 ,v2) 


7.3 MATLAB 优 化 工具 箱 
续 表 
问 题 模 型 基本 命令 的 用 法 基本 的 . m 文件 
in 工 2 和 : . 
非 线性 最 小 二 条 |"™" 本 Fo 下 Sm V1, fonction r=FCx) 
s.t. USYx 雪 ; 由 
二 2 | 
oo Ea 三 | » EE 
非 线性 拟 合 min 3 | Fz,t) yi ix Oo x0, + ro yy ED 
s.t, VI 人 XV LAA 
miny 
s.t, F(x)—wx*x yg 
C(x)<0 x= fgoalattain ( @f, x0, g, rol Ee 
多 目标 (目标 ) 规 划 C(x)=0 w,Al,bl1, A2,b2,v1,v2, @ ee c2]=com 
Aix<b C) 
A,x=b, 
贡生 xz 妇 o， 
半 无 穷 规划 (〈 略 ) fseminf( 具 体形 式 略 ) 〈 略 ) 


在 表 7.2 中 用 f 表示 标量 值 函 数 , 用 下 表示 向 量 值 函数 , 即 F(x) 二 (f;(z))', 可 以 看 
出 ,实验 6 中 介绍 的 fzero 和 fsolve 函数 实际 上 也 属于 优化 工具 箱 的 功能 . MATLAB 对 
连续 优化 问题 求解 提供 了 非常 丰富 的 程序 ,而 对 离散 优化 问题 的 求解 ,目前 提供 的 功能 还 
不 多 (即使 MATLAB 7.0 版 本 也 仅 能 解 纯 0-1 规划 ). 

本 节 主 要 介绍 求解 无 约束 极 小 ( 非 线性 规划 ,包括 非 线 性 最 小 二 乘 拟 合 ) 的 命令 的 用 
法 ,实验 8 将 介绍 求解 约束 极 小 (线性 规划 、 二 次 规划 一 般 非 线 性 规划 ) 的 命令 的 用 法 . 


7.3.2 fminbnd、fminunc 和 fminsearch 的 基本 用 法 


有 界 单 变量 优化 严格 来 说 属于 约束 优化 ,但 由 于 它 的 约束 非常 简单 (只 有 上 下 界 约 
束 ), 所 以 MATLAB 设计 了 一 个 单独 的 求解 程序 fminbnd, 其 基本 算法 是 黄金 分 割 法 和 插 
值 法 . fminunc 和 fminsearch 都 可 以 用 来 解 无 约束 优化 ,但 fminunc 采用 的 是 拟 牛 顿 法 或 置 
信 域 方法 ,需要 用 到 函数 的 导数 (梯度 、 雅 可 比 矩 阵 或 黑 塞 矩 阵 ) ,而 当 函 数 高 度 非 线性 其 
至 不 连续 时 ,数值 梯度 ( 即 用 有 限 差分 法 计算 导数 ) 将 很 不 准确 ;fiminsearch 采用 的 是 单纯 
形 搜索 法 ,不 需要 用 到 函数 的 导数 ,因此 有 时 称 为 直接 法 . 这 三 个 命令 最 一 般 的 调用 方式 
分 别 是 : 


[x,fv:ef,outj= fminbnd( @f,x1,x2,opt,P1,P2,...) 
[x.,fv, ef, out, grad, hess] = fminunc( @f,x0,opt,P1,P2,...) 
[x,fv,ef,out] 二 fminsearch( @f, x0 ,opt, P1,P2,...) 


其 中 输入 列表 和 输出 列表 与 实验 6 中 命令 fzero 的 说 明 类 似 , 输 出 grad 是 结果 (x 点 ) 处 的 
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梯度 向 量 ,hess 是 x 点 所 对 应 的 黑 塞 和 矩阵 . 下 面 看 两 个 简单 的 例题 . 
例 1 求解 min (3sinz 十 zz). 


解 ” 输 入 程序 : 


x1= 1;x2=8; % 上 下 界 
f= inline('3 x SinCX) + x'); 
Lx,fv] = fminbnd(f,x1, x2) 


输出 结果 : 
x= 4.3725596, fv = 1.544125. 
xy 
例 2 求解 min 一 十 一 ,a 一 0 一 2. 
a b 
解 ” 建 立 exam0702fun. m 文件 计算 函数 值 : 


function y= exam0702fun(x,a,b) 
y=x(1)"2/at+ x(2)°2/b; 


取 初 始 值 [1,1], 输 入 程序 : 

x=fminunc( @exam0702fun,[1.1],[],2,2) 

输出 结果 为 : 

x= 1.0e 一 009x* (1.7116,1.7116) 

如 果 输 入 程序 : 

x=fminsearch( @exam0702fun, [1,1],[],2,2) 

则 输出 结果 为 ， 

x =1.0e 一 004x (一 0.2102，0.2548) 

本 题 的 精确 结果 为 zi 二 zx; 二 0. (为 什么 fminsearch 的 精度 低 些 ? 再 输出 迭代 次 数 看 
看 , 哪 一 个 命令 的 迭代 次 数 多 些 ?) 
7.3.3 lsqnonlin 和 lsqcurvefit 的 基本 用 法 


isqnontin 和 lsqcurvefit 都 可 以 处 理 变 量 有 上 下 界 的 约束 ,因此 严格 来 说 属于 约束 优 
化 . 其 实 这 两 个 命令 采用 的 算法 完全 一 样 ,只 是 调用 方法 略 有 区 别 , 最 一 般 的 调用 方式 分 
别 是 : 


Lx,norm,res,ef, out,lam,jac] = Isqnonlin( @F ,x0,v1,v2,opt,P1,P2,...) 
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Lx,norm,res,ef,out,lam,jac] = lsqcurvefit( @F,x0,t,y,v1,v2,opt,P1,P2,...) 


其 中 输入 列表 和 输出 列表 与 前 面 物 说 明 类 似 , 输 出 norm 和 res 分 别 是 误差 的 平方 和 和 误 
差 向 量 , jac 是 结果 (x 点 ) 处 的 雅 可 比 矩 阵 , lam 是 上 下 界 所 对 应 的 拉 格 朗 日 乘 子 (其 含义 
将 在 实验 8 中 介绍 ). 下 面 通过 例子 说 明 这 两 个 命令 的 具体 用 法 . 


例 3 用 表 7.3 中 一 组 数据 拟 合 c(z) 二 re“ 中 的 系数 x,k. 


表 7.3 


解 ” 建 立 exam0703fun. m 文件 计算 函数 值 : 


function f= exam0703fun(x,t) 
f=x(1) x exp(x(2) x t); 


输入 程序 : 


x0=[10,0.5]; 

t=[.25.511.523468]; 

c=[19.21 18.15 15.36 14.1 12.89 9.32 7.45 5.24 3.01]; 
[Lx,norm,res |= Isqcurvefit( @ exam0703fun, x0 , t, c) 


输出 结果 (可 以 输入 不 同 的 初 值 x0 ,观察 结 果 是 否 有 变化 );: 


x =20.2413 一 0.2420 % 即 r=20.2413,k= 一 0.2420 
norm 一 1.0659 ”“% 误差 平方 和 , 即 res* res' 
res = % 误差 向 量 
一 0.1568 一 0.2152 0.5311 一 0.0198 一 0.4143 0.4744 0.2394 一 0.5006 
一 0.0889 


也 可 以 用 lsqnonlin 命令 求解 如 下 . 
建立 exam0703funl. m 文件 计算 函数 值 ， 


function f= exam0703fun1 (x,t,c) 
{f=x(1) x exp(x(2) x t)-c; 


输入 程序 : 


x0=[10,0.5]j:; 

t=[.25 .511.523468]; 

c=[19.21 18.15 15.36 14.1 12.89 9.32 7.45 5.24 3.01]; 
[x,norm,res]= Isqnonlin( @exam0703fun1 ,x0,[],[],[],t,c) 
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输出 结果 同 前 (实际 上 ,两 者 使 用 的 算法 是 一 样 的 ). 
7.3.4 控制 参数 的 设置 


前 面 例子 中 已 经 看 到 ,在 每 个 优化 程序 中 可 以 有 一 个 控制 变量 opt(options 的 简写 )， 
虽然 我 们 总 是 不 指定 它 或 指定 为 [j( 即 采用 缺 省 值 ). opt 是 一 个 非常 复杂 的 结构 变量 , 含 
有 用 于 控制 程序 运行 的 许多 参数 , 供 使 用 者 在 计算 时 控制 输入 输出 形式 .选择 算法 、 指 定 
精度 要 求 和 迭代 次 数 等 . 因此 ,根据 具体 问题 设 定 这 些 控 制 参 数 能 够 将 优化 工具 箱 用 到 
“专家 水 平 ", 具 有 一 定 的 技巧 性 . 但 是 完全 掌握 它 有 一 定 难 度 , 这 不 仅 因为 控制 参数 很 多 
(目前 多 达 30 多 个 ,将 来 还 可 能 进一步 增加 ;当然 也 不 是 每 个 参数 对 每 个 优化 程序 都 起 作 
用 ) ,而 且 因为 有 些 参 数 要 用 到 较 深 的 优化 方面 的 专业 术语 、 专 门 算法 等 知识 . 

表 7.4 中 简要 列 出 了 这 些 控制 参数 的 名 称 、 功 能 .可 能 取 值 及 缺 省 值 .适用 规模 和 命 


表 7.4 优化 工具 箱 中 控制 参数 (options) 的 功能 


参数 名 称 功能 和 含义 可 能 取 值 和 缺 省 值 “规模 适用 命令 
用 户 定义 的 分 析 
导数 (梯度 或 雅 


fgoalattain，fmincon， fminimax, 
fminunc, fseminf, fsolve, 
Isqcurvefit, Isqnonlin 


可 比 和 矩阵 . 黑 塞 | 'on' B 
和 矩阵) 与 有 限 差 |'off'( 缺 省 值 ) 
分 计算 的 数值 导 
数 进行 比较 


DerivativeCheck 


可 和 站 
Di ti je i ‘on' B 除 fminbnd, fminsearch， 
oS 二 ‘off'《 缺 省 值 ) fzero，lsqnonneg 以 外 


诊断 信息 


‘off' (不 显示 ) 


程序 运行 的 显示 | 'iter' (每 步 迭 代 信 息 ) 


Display B | 全 部 程序 


级 别 ‘final( 最 后 的 信息 ) 
notify'"( 和 迭代 不 收敛 时 ) 
on 
由 用 户 定义 目标 | 'on' fgoatattain, fmincon, 
| ee 
Gradob) 函数 的 梯度 函数 | 'off' ( 缺 省 值 》 fminimax , fminunc, fseminf 


阵 计算 方法 。 | 中国 种 值 ) 


= di a i em 人 
由 用 户 定义 目标 a 
“5 | Jacobian 水 数 的 收 可 比 答 B ,fsolve, Ilsqcurvefit, Isqnonlin 
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序号 参数 名 称 功能 和 含义 可 能 取 值 和 缺 省 值 ”规模 适用 命令 
i i > 1 9 
“6 |LargeScale 如 果 可 能 的 话 ,| ofr(fsolve 的 缺 省 值 ? 卫 RN be 
使 用 大 规模 算法 l'on'( 其 他 程序 的 缺 省 值 ) genonli odproo 
| 1goalattain, fminbnd, fmincon, 
函数 调用 的 最 大 el fminimax, fminsearch, fminunc, 
Cl Mesa vals 次 数 任意 正 整数 fseminf, fsolve,isqcurvefit, 
lsaqnonlin 
“8 | Maxlter 迭代 的 最 大 次 数 | 任意 正 整数 B | 除 fzero 和 lsqnonneg 以 外 
用 户 指定 一 个 函 | 用户 定义 的 函数 名 《 字 fgoalatiain, fmincon 
9 | OutputFcn ns < ee P| B |fminimax, he tee 
We 从 全 [了 入 lsqcurvefit, Isqnonlin 
约束 函数 g 的 | ,> fgoalattain, fmincon, 
| 精度 任意 正 数 四 fminimax, fseminf 
fgoalattain, fmincon, 
二 fminimax, fminsearch, 
“11| TolFun ng 销 数 了 的 任意 正 数 B | fminunc, fseminf, fsolve, 
人 lsqcurvefit，lsqnonlin; 大 规模 
linprog, lsqlin, quadprog 
S ， , a 除 中 规模 的 linprog，lsqlin， 
12| TolX 解 工 的 精度 任意 正 数 B Gd 
由 用 户 定义 目标 上 
”13| Hessian 函数 的 黑 塞 矩 阵 L | fmincon, fminunc 
'off'( 缺 省 值 ) 
| 计算 方法 es 
| 用 户 定义 的 黑 塞 | 用 户 定义 的 函数 名 | | 
14 | HessMult 凡人 L |fmincon, fminunc, quadprog 
| 矩阵 乘积 落 数 []( 缺 省 值 ) 
用 有 限 差分 法 计 
算 黑 塞 矩 阵 时 ,| 稀 朴 矩阵 ( 缺 省 值 为 元 
15 | HessPattern 采用 务 朴 算 阵 | 素 全 为 1 的 稀 政 矩阵 ) L |fmincon, tminunc 
方式 
| 用 户 定义 的 雅 可 | 用 户 定 义 的 函数 名 fsolve, lsqcurvefit, 
比 矩 阵 乘积 函数 | []( 缺 省 值 ) ”| lsqlin, isqnonlin 
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序号 参数 名 称 功能 和 含义 可 能 取 值 和 缺 省 值 ”规模 适用 命令 
用 有 限 差 分 法 计 
17 | JacobPattern 算 雅 可 比 抵 阵 | 稀 朴 矩阵 《 缺 省 值 为 元 L | fsolve，lsqcurvefit，lsqnonlin 
时 ,采用 稀 朴 矩 | 素 全 为 1 的 稀 玖 和 矩 阵 ) 
阵 方 式 
PCG 和 迭代 的 最 大 fmincon，fminunc ，fsolve 
18 | MaxPcalter 次 数 CPCG 是 带 | 正 整数 ( 缺 省 值 为 max| 工 aoanit sqlin, | 
巴 处 理 的 共 绒 梯 up 了 tsqnonlin uad 入 
度 法 的 缩写 ) i 
ee 正 整 数 fmincon, fminunc, {solve, 
| PCG 选 代 带宽 |0( 缺 省 值 ) L | lsqcurvefit, Isqlin, 
Inf isqnonlin, quadprog 
fmincon, fminunc, fsolve, 
20 | TolPCG PCG 和 迭代 的 精度 | 正 数 ( 缺 省 值 为 0. 1) L jlsqcurvefit，isqlin， 
Isqnonlin, quadprog 
向 量 ( 维 数 与 初始 值 向 fmincon，fminunc，fsolve， 
21 | TypicalX 典型 的 二 取 值 量 相 同 , 缺 省 值 为 元 素 | L | lsqcurvefit, lsqlin, 
全 为 的 向 量 ) Isqnonlin ，quadprog 
用 有 限 差分 计算 fgoalattain, fmincon, 
22 | DiftMaxChange | 梯度 时 步 长 的 | 正 数 ( 缺 省 值 为 0.71) M | fminimax, fminunc, fseminf, 
上 限 fsolve, lsqcurvefit, Isqnonlin 
用 有 限 差分 计算 
23 | DiftMinChange 梯度 时 步 长 的 | 正 数 ( 缺 省 值 为 le 一 8) | M | 同上 
下 限 
GoalsExact 精确 达到 的 目标 | 正 整数 
Mi t 
24 和 NSS 个 数 0( 缺 省 值 ) goalattain 
非 线性 约束 的 梯 i 
4 t * t 
,25| GradConstr 度 函 数 由 用 户 on M goalat ain, fmincon 
'off'《 缺 省 值 》 fminimax 
定义 
bfgs( 缺 省 值 ) 
26 | HessUpdate 拟 和 牛顿 法 修改 M | fminunc 
方式 'gillmurray' 
Steepdesc' 
27 Levenberg 人 on'( 缺 省 值 ) M | lsqcurvefit，lsqnonlin 
Marquardt 人 off (Gauss-Newton 法 ) 中 Re 


Marquardt 法 
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参数 名 称 功能 和 含义 可 能 取 值 和 缺 省 值 ”规模 适用 命令 
n | be 'cubicpoly' fminunc, fsolve, 
28 | LineSearchType | 选择 线 搜索 方法 quadcubic'( 缺 省 值 ) M Isgcurvefit, lsqnonlin 
SQP 迭代 的 最 大 2 
次 数 (SQP 是 顺 
29 | MaxSQPIter 序 二 次 规划 的 缩 正 整 数 M |fmincon 
写 ) 


多 目标 优化 ( 目 


‘singleobj' 


MeritFunction M | fgoalattain, fminimax 


标 优 化 ) multiobj( 缺 省 值 ) 
F(z) 达到 最 
| ee , 
31 | MinAbsMax 坏 情 形 ( 按 绝对 0( 馈 省 值 M | fminimax 
值 ) 的 个 数 
el | 1 《 AL ， 蜂 Pe 
搜索 方向 选用 ogleg 缺 省 值 , 置信 
域 算 法 ) 
NonlEan Levenberg- 
32 . mMm' (Levenburg- M | fsolve 
Aigorithm Marquardt 或 
Gauss-Newton 法 Marquardt) 
| 'gn' (Gauss-Newton) 
二 
33 | Simplex 选择 单纯 形 算法 ee ( 缺 省 值 ) M |linprog 
然 
34 | ActiveCorstrTol 起 作 央 光束 的 正 数 
精度 


用 户 定义 的 函数 名 [] 
〈 缺 省 值 ) 

‘off' 

‘on' 


35 | Preconditioner 预 处 理 程序 


ShowStatus 显示 求解 状态 窗 


36 1iter' 
"iterplus' 
final 


Window 口 信息 的 级 别 


表 7.4 的 简单 说 明 : 

1.“ 序 号 ”前 带 “ x ”的 表示 该 参数 是 常用 的 ,读者 应 尽量 掌握 . 

2. 有些 参 数 没有 标 出 缺 省 值 , 说 明 该 参数 在 不 同 的 优化 程序 中 的 缺 省 值 可 能 不 同 ， 
需要 视 具 体 的 优化 程序 而 定 . 

3.“ 适 用 规模 ”一 列 中 标注 的 是 该 参数 在 哪 种 算法 模式 下 才 适 用 ( 表 7.4 是 按 该 列 排 
序 的 ). 在 优化 工具 箱 中 ,每 个 求解 程序 都 配 有 大 规模 算法 (L) 和 中 等 规模 算法 (M, 也 称 
为 标准 算法 ), 而 标注 为 B 则 表示 该 参数 在 两 种 算法 模式 下 均 适 用 . 粗略 地 讲 , 大 规模 算 
法 主要 是 针对 具有 稀疏 矩阵 结构 的 问题 设计 的 算法 ,并 通常 希望 用 户 提供 分 析 导 数 (梯度 


人 


实验 7 无 约束 优化 


或 雅 可 比 矩 阵 、. 黑 塞 矩 阵 ). 

4. 表 ?7.4 中 最 后 列 出 的 3 个 参数 (序号 34 一 36) 在 优化 工具 箱 的 在 线 说 明文 档 中 没 
有 提 到 过 ,所 以 我 们 暂时 不 清楚 它们 所 适用 的 算法 模式 和 程序 . 

5. 在 实际 使 用 中 ,“ 参 数 名 称 ” 不 要 求 写 完全 ,而 且 也 不 区 分 大 小 写字 母 ,只 要 没有 歧 
义 即 可 ,如 DerivativeCheck 可 以 写成 derivative 甚至 DE 等 . 

控制 参数 是 通过 程序 optimset 设 定 的 ,有 以 下 几 种 用 法 : 


optimset % 不 带 任何 输入 输出 参数 时 ,显示 所 有 的 控制 参数 名 及 其 可 能 的 取 
值 ({} 内 为 缺 省 值 ) 
opt= optimset % 生成 结构 变量 opt, 其 中 所 有 控制 参数 的 取 值 均 为 L]( 即 缺 省 值 ) 


opt= optimset(optimfun) % 生成 结构 变量 opt, 控 制 参 数 取 值 为 命令 optimfun 的 缺 省 值 

opt= optimset('p1', v1,'p2', v2, ...) 

% 生成 结构 变量 opt, 控 制 参数 p1 取 值 v1,p2 取 值 v2,….( 未 指定 的 参数 取 值 均 为 口 ) 

new= optimset(old,'p1',v1,'p2', v2,...) 

% 生成 结构 变量 new, 控 制 参数 p1 取 值 v1,p2 取 值 v2,.….( 未 指定 的 参数 取 值 同 结构 变量 old) 
opt= optimset(old, new) 

% 生成 结构 变量 opt, 采 用 结构 变量 new 中 的 非 空 参 数值 (new 中 未 指定 的 参数 取 值 同 结构 变量 
old) 


要 从 一 个 优化 参数 的 结构 变量 opt 中 读 出 控制 参数 ,可 以 使 用 程序 optimget, 有 两 种 
用 法 : 


v= optimget(opt, 'param’) % 从 opt 中 读 出 控制 参数 param 的 值 ( 赋 给 变量 v) 
v= optimget(opt, 'param', default) % 同 上 ,车 opt 中 没有 指定 参数 值 , 则 取 值 为 default 


下 面 的 例子 说 明 控 制 参数 中 一 部 分 参数 的 用 法 . 
例 4 求解 min 全 十 至 ,a 二 10,6=1, 观察 中 间 结 果 ; 将 解 和 西数 值 的 精度 提高 到 


10-5 ,给 出 迭代 次 数 及 结果 的 函数 值 .， 
解 与 例 2 的 区 别 除了 a,6 的 数值 以 外 ,还 需要 观察 中 间 结 果 ,程序 为 


a=10;b=1;x0=[L1,1j; % 初始 值 

opt= optimset(fminunc) ; % 程序 fminunc 缺 省 的 控制 参数 

opt= optimset(opt,'Disp', 'iter’) ; % 设 定 输出 中 间 结 果 

x= fminunc( @exam0702fun, x0 ,opt,a;sb) 

输出 为 ;: 

lteration Func-count {Cx) Step-size Directional derivative 
0 3 1.1 


1 9 0.0809191 0.504495 7.81e-009 
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2 16 7.93057e-017 4.95545 4.08e-010 
3 17 6.10623e-017 1 一 5.52e-016 
Optimization terminated successfully: 
Search direction less than 2 * options. TolX 
x=1.0e—008" 0.7451 一 0.7451 


表明 经 3 次 迭代 得 zx 二 0.7451X10 ,zs 一 一 0.7451X10-8( 查 看 opt 的 值 知 缺 省 控 
制 精度 opt. TolFun= opt.TolX= 10-: ,程序 fminunc 要 求 这 两 个 精度 同时 达到 才 停 止 先 
代 ,而 优化 工具 箱 中 的 其 他 程序 通常 只 要 达到 其 中 一 个 精度 就 停止 迭代 ). 中 间 结 果 给 出 
了 和 办 代 次 数目 标 函 数 调用 次 数 、 函 数值 . 步 长 .搜索 方向 导数 值 (1- 范 数 ). 

要 将 精度 提高 到 10™ ,只 给 出 迭代 次 数 及 结果 的 函数 值 ,不 看 中 间 结 果 , 可 如 下 利用 
控制 精度 : 


a=10;b=1;x0=[1,1]; | % 初始 值 
opt= optimsetC fminunc') ; % 程序 fminunc 缺 省 的 控制 参数 
opt= optimset(opt, tolx', 1e-16 ,tolf, 1e-16) ; % 设 定 控制 精度 
[x,fyef,out]=fminunc(@exam0702fun,x0 ,opt,a,b) 
输出 结果 为 : 
x = 三 1.0e 一 010” 一 0.8735 一 0.1866 
= 1.1112e-021 ”% 应 数值 
ef 二 1 
-out 三 
iterations : 5 % 迭代 次 数 
funcCount : 30 % 目标 函数 调用 次 数 


stepsize : 0.0951 
firstorderopt : 1.5044e-008 


algorithm : medium-scale : Quasi-Newton line search' 


7.3.5 fminunc 和 lsqnonlin、lsqcurvefit 的 算法 选择 


fminunc 目前 为 无 约束 优化 的 搜索 方向 提供 了 4 种 算法 ,由 HessUpdate 参数 控制 ; 
HessUpdate 王 bfgs'( 拟 牛顿 法 的 BFGS 公式 , 缺 省 值 ) 
HessUpdate 王 dfp' ( 拟 牛 顿 法 的 DFP 公式 ) 
HessUpdate 一 'qillmurray' ( 拟 和 牛顿 法 的 Gill-Murray 公式 ,MATLAB 中 不 再 使 用 ) 
HessUpdate 一 Steepdesc' (最 速 下 降 法 ) 
lsqnonlin 和 lsqcurvefit 为 非 线 性 最 小 二 乘 拟 合 的 下 降 方向 提供 了 两 种 算法 ,由 
LevenbergMarquardt 控制 : 
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LevenbergMarquardt 一 'off (Gauss-Newton 法 (GN)) 

LevenbergMarquardt 王 "on' (Levenberg-Marquardt 法 (LM)， 缺 省 值 ) 

fminunc ,lsqnonlin 和 lsqcurvefit 目前 为 无 约束 优化 的 步 长 一 维 搜索 提供 了 两 种 算法 ， 
由 LineSearchType 控制 

LineSearchType 二 'quadcubic'( 缺 省 值 )， 混合 的 二 和 三 次 多 项 式 插值 ; 

LineSearchType= 'cubicpoly' 0 

用 下 面 的 例子 说 明 fminu 的 算法 选择 和 比较 . 

例 $ Rosenbrock 函数 

JCziyza) 一 100(zs 一 好 ) 六 十 (1 一 并 2 

的 最 优 解 ( 极 小 ) 为 x" 二 (1,1), 极 小 值 为 f* 二 0. 试用 不 同 算法 (搜索 方向 和 步 长 搜索 ) 求 
数值 最 优 解 , 初 始 值 选 为 (一 1. 9,2). 

解 ” 为 获得 直观 认识 , 先 画 出 Rosenbrock 函数 的 三 维 图 形 和 等 高 线 图 (图 7. 3)， 


.0 0 1, 
-0.5 0.5 1.5 
四 Rosenbrock 函数 的 等 高 线 图 


[x,y]=meshgrid( —2:0.1:2,—1:0.1:3); % 产生 二 维 数组 集合 
Z 三 100x*(y 一 X."2)."2 十 (1 一 X); 

mesh(x,y,z) % 画 三 维 网 格 图 
pause; 

contour (x ,y,z,20) % 表 等 高 线 图 (20 条 ) 


可 以 看 出 ,Rosenbrock 函数 呈 绕 过 原点 的 弯曲 形状 (该 函数 形象 地 称 为 香 巷 函数 )， 
从 初始 点 到 最 优点 有 一 -狭长 通道 ,不 利于 沿 负 梯 度 方向 下 降 , 是 检验 优化 算法 性 能 的 有 名 
的 函数 . 

用 4 种 搜索 方向 (BFGS,DFP,GillMurray 和 最 速 下 降 法 ) 及 两 种 步 长 搜索 (混合 二 、 
三 次 插值 和 三 次 插值 ) 计 算 : 

function f= exam0705fun(x) % 建立 exam0705fun.m 文件 

f= 100 x (x(2) 一 xX(1) 2) 2 十 (1 一 x(1)) 2; 


% comparing different algorithms ”without using gradient vector 
format short e 

x0 一 [一 1.9,2]; 

(----Case1 : bfgs，hybrid 2 ,3 poly------- 

opt1= optimset('‘LargeScale', 'off', 'MaxFunEvals', 1000); 
[x1,v1,exit1, out1]= fminunc('exam0705fun', x0 ,opt1) 

pause 

---Case2 : dfp, hybrid 2,3 poly---—--' 

fopt= optimset(opt1,'HessUpdate', 'dfp') ; 


. [x2,v2, exit2, out?2 ]= fminunc('exam0705fun' ,x0 ,fopt) 
- pause 


~--Case3 : gillmurray， hybrid 2,3 poly-- 一 --- 

fopt= optimset(opt1,'HessUpdate', ‘gillmurray’) ; 
[x3,v3,exit3,out3]= fminunc('exam0705fun', x0 ,fopt) 
pause 

'--Case4 : steep, hybrid 2,3 poly------- 

fopt= optimset(opt1,'HessUpdate', 'steepdesc" ; 

Lx4, v4, exit4 , out4] = fminunc('exam070Sfun', x0 ,fopt) 
pause 

'--case5D : bfgs: 3rd pofy------- 

opt2 = op:imset(opt1,'LineSearchType"', 'cubicpoly') ; 
[x5, v5 ,exit5, out5]= fminunc('exam0705fun', x0, opt2) 
pause 

---Case6 : dfp, 3rd poly------- l 

fopt= optimset(opt2, 'HessUpdate','dfp') ; 

[x6 , v6, exit6 ,out ] = fminunc (‘exam0705fun', x0 , fopt) 
pause 

+---Case7 : gilimurray, 3rd poly------- 

fopt= optimset(Copt2 ,HessUpdate' 'gillmurray") ; 
Lx7,v7 ,exit7,out7]=fminuncCexam0705fun',x0 ,fopt) 
pause 

'---Case8 : steep, 3rd poly------- | 

fopt= optimset(opt2 ,'HessUpdate', 'steepdesc') ; 

[x8, v8 ,exit8 ,out8]= fminunc('exam0705fun', x0 ,fopt) 
pause 

' 十 十 十 十 results of solutions 十 十 十 十 十 十 ' 
solutions = [x1;x2;x3;x4;x5;x6;x7;x8]; 

funvalues= [v1;v2;v3;v4;v5;v6;Vv7;v8]; 
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iterations = [out1. funcCount; out2. funcCount; out3. funcCount; out4. funcCount; out5. funcCount; out6 . 


funcCounit; out7. funcCount; out8. funcCount |] ; 


[solutions ,funvalues ,iterations] 


将 各 种 算法 的 计算 结果 列 人 表 7. 5. 


表 7.5 Rosenbrock 函数 不 同 算法 的 计算 结果 
oo pd g 目标 函 交 
情况 | 搜索 方向 | 步 长 搜索 | ”最 优 解 最 优 解 x 最 优 值 。 “| 且 称 函数 
| zl 调用 次 数 
bfgs 9. 9985e 一 001 | 9.9969e 一 001 | 2.4362e 一 008 161 
| | 
2 | dfp 混合 二 、 9. 9999e 一 001 | 9.9999e—001 | 5.3925e 一 011 180 
3 | gillmurray 三 次 插值 | 9.9985e 一 001 | 9.9970e 一 001 | 2.3209e 一 008 161 
4 | steepdesc 一 8.0373e 一 001 | 6.5241le—001 | 3.2576e+000 | 1004° 
5 | bfgs 9.9999e 一 001 | 9.9998e 一 001 | 9.6801e—011 | 160 
6 | dfp 9.9987e—001 | 9.9975e 一 001 | 3.7474e 一 008 | 235 
三 次 插值 = 
7 | gilmurray 1. 0000e 士 000 | 1.0000e+000 | 3.2040e 一 010 166 
8 | Steepdesc 一 1.2156e 十 000 | 1.4862e 十 000 | 4.9162e+000 | 1003* 


好 ,而 最 速 下 降 法 效果 并 不 好 (这 里 根本 不 收敛 )， 
MATLAB 中 将 这 个 函数 作为 优化 方法 的 演示 例子 (demo) ,大 家 可 以 从 它 的 动态 滋 
示 中 清楚 地 看 到 各 种 算法 迭代 的 路 径 和 速度 . 


* 增加 选 代 次 数 也 不 能 改善 结果 。 
在 上 述 结果 中 以 BFGS 和 混合 二 、 三 次 插值 算法 的 性 能 ( 即 缺 省 参数 值 所 给 出 的 ) 较 


流 


本 题 函 数 是 平方 和 的 形式 ;因此 也 可 以 用 最 小 二 乘法 程序 lsqnenlin 求解 . 首先 编写 
如 下 函数 ， 
function f= exam0705isqfun(Cx) 
1(1)=10x* (x(2) ~ x(1)°2); 


1(2)=1— x(1); 


然后 输入 : 
x0=[ 一 1.9,2]; 


opti = optimset('LargeScale'. 'off', MaxFunEvals', 1000) ; 


% 缺 省 为 LM 法 


[x1,norm1 ,res1, exitt ,out1]= Isqnonlin('exam0705Isqfun', x0, [],[] ,opt1) 
% 改 为 GN 法 
[x2 ,norm2 ,res2 ,exit2 ,out2] = Isqnonlin('exam0705Isqfun', x0,[],[] ,opt2) 


计算 结果 :最 优 解 均 为 (1. 0000,1. 0000), 但 LM 法 迭代 了 18 次 (目标 函数 调用 118 


opt2 = optimset(optl, LevenbergMarquardt', 'off’) ; 
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次 ) ,而 GN 法 迭代 了 11 次 (目标 函数 调用 70 次 ). 注意: 由 于 一 次 迭代 中 可 能 要 多 次 调 
用 目标 函数 ,因此 目标 函数 调用 次 数 与 迭代 次 数 不 是 同一 个 概念 . 

7.3.6 梯度 计算 
从 7. 2 节 我 们 知道 ,无 论 是 最 速 下 降 法 还 是 拟 牛 顿 法 的 BFGS、DFP 或 Mill-Gurray 
公式 ,都 要 计算 函数 的 梯度 . MATLAB 采用 两 种 方法 计算 导数 : 数值 方法 用 函数 的 差分 
作为 梯度 的 近似 ;分 析 方 法 给 出 精确 的 梯度 . 上 面 例子 中 用 的 程序 都 是 数值 方法 , 若 用 分 
析 方 法 则 应 计算 目标 函数 的 梯度 ,并 将 其 写 人 目标 函数 所 在 的 M 文件 . 


以 Rosenbrock 函数 为 例 说 明 如 下 . 


function [1,g9] = exam0705grad(x) 

1= 100 x (x(2)—xC1)°2)°2+ (1—x(1))°2; 

if nargout > 1 

g(1)=—2x(1~—x(1))— 400 x xC(1) x (x(2)— x(1)°2); 
g(2)=200 x (x(2)—x(1)"2); 

end 


% 建立 含 梯度 的 exam0705grad. m 文件 
% 计算 函数 值  . 

% 当 函 数 用 两 个 输出 参数 调用 时 

% 计算 梯度 值 


与 上 面 例子 中 一 样 ,只 是 需要 将 GradObj 参数 设置 为 on', 如 对 于 情况 1 输入 : 


x=[—1.9,2]; 


opt1= optimset('LargeScale', 'off', 'MaxFunEvals', 1000 ,'GradObj', on ; 


[x1,v1,exit1,out1]= fminunc('exam0705grad', x0 , opt1) 


将 用 分 析 方 法 给 出 梯度 的 计算 结果 列 入 表 7. 6, 与 数值 方法 相 比较 ,通常 分 析 方法 要 
好 一 些 . 


表 7.6 Rosenbrock 函数 用 分 析 方 法 计算 梯度 的 结果 


本 ee 目标 函数 

搜索 方向 步 长 搜索 最 优 解 zi 最 优 解 za 最 优 值 | SS 

调用 次 数 
bfgs 1. 0001e 十 000 1. 0002¢ 十 000 8.9856e 一 009 106 
混合 二 、 1.0001e 十 000 ]. 0003e 十 000 2. 2515e 一 008 110 
gillmurray 三 次 插值 1. 0001e 十 000 1. 0002e 十 000 8.9856e 一 009 106 
4 | Steepdesc 一 2.5150e 一 001 8. 2350e- 一 002 1. 6027e 十 000 1002 
5 | bfgs 1. 0000e 十 000 1. 0001e 十 000 1. 2748e 一 009 54 
6 1. 0007e 十 000 1. 0015e 十 000 6. 2856e 一 007 202 

三 次 插值 

7 gilimurray - 9. 9999e 一 001 9. 9998e 一 001 6. 4839e 一 009 56 
steepdesc 一 1.0590e 十 000 1. 1245e 十 000 4. 2404e 十 000 402 


SN 
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同样 ,最 小 二 乘 算 法 中 也 可 以 采用 分 析 导 数 ( 雅 可 比 矩 阵 ) : 


function [f,g]= exam0705jacob(x) % 建立 念 雅 可 比 矩 阵 的 exam0705jacob.m 文件 
f=[10* (x(2)—xC1)°2) ,1~x(1)]; 
if nargout > 1 % 当 函 数 用 两 个 输出 参数 调用 时 
:. g=[—20xxC1),10;~ 1,0j.; : 
end 
x0=[—1.9,2]; 


opt1 = optimset(LargeScale' 'off', 'MaxFunEvals', 1000， Jacobian','on) 
[x1,norm1l,res1,exit1,out1]=lsqnonlinCexam0705jacob' x0,[],[],optT) 


得 到 的 结果 与 用 导数 数值 时 类 似 , 选 代 次 数 并 没有 减少 , 只 是 函数 调用 次 数 减 少 了 (为 
什么 ?). 
lsqcurvefit 和 fsolve 中 采用 分 析 导 数 ( 雅 可 比 和 矩阵 ) 的 方法 也 与 此 类 似 . 


7.3.7 几 点 注意 事项 


计算 过 程 中 接近 最 优 解 时 ,由 于 梯度 计算 中 截断 误差 或 合 人 误差 等 因素 的 影响 ,可 能 
会 出 现 因 和 矩阵 病态 使 收敛 太 慢 等 警告 信息 ,一 般 情况 下 只 要 能 够 继续 算 下 去 就 可 以 忽略 . 
如 果 要 改进 结果 ,可 以 从 以 下 几 方 面 考虑 . 

1. 改变 算法 

一 般 情况 下 程序 中 控制 参数 的 缺 省 值 所 给 出 的 是 比较 好 的 方法 ,但 应 注意 
MATLAB 提供 的 算法 没有 绝对 的 优 劣 之 分 . 最 速 下 降 法 特别 不 适 于 从 一 狭长 通道 到 达 
最 优 解 的 情况 :如 果 函 数 高 度 非 线 性 或 者 严重 不 连续 ,可 以 考虑 改 用 只 用 函数 值 、 不 计算 
导数 的 程序 fminsearch. 

2. 利用 分 析 方 法 计算 梯度 

由 于 数值 方法 计算 梯度 中 步 长 选择 .截断 误差 等 的 影响 ,一 般 说 来 用 分 析 方 法 计算 的 
梯度 结果 较 好 . 

3. 改变 初始 值 

初 值 的 选择 对 于 迭代 过 程 的 收敛 快慢 影响 很 大 .更 为 重要 的 是 ,用 任何 算法 由 一 个 初 
值得 到 的 只 是 局 部 最 优 解 , 如 果 函 数 存在 多 个 局 部 最 优 ,那么 只 有 具体 问题 具体 分 析 , 或 
改变 初 值 ,对 局 部 最 优 进行 比较 , 才 有 可 能 得 到 全 局 最 优 解 ， 

4， 其 他 

精度 要 求 要 适中 ,不 要 无 必要 地 提高 精度 ; 迁 代 次 数 上 限 .函数 调用 次 数 上 限 等 也 要 
适中 . 实际 中 的 大 规模 问题 通常 具有 稀疏 结构 ,应 充分 利用 这 种 结构 ,选择 大 规模 方法 并 
控制 优化 参数 . 
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7.3.8 产销 量 的 最 佳 安排 ( 续 ) 


7.1.1 小 节 中 已 经 建立 了 模型 (3) ,问题 表述 为 求 两 种 型 号 甲 和 乙 的 产量 zi ,zs ,使 总 
利润 x(zi,zs) 最 大 ,为 了 用 MATLAB 优化 工具 箱 的 fminunc 求解 这 个 无 约束 优化 模型 ， 
令 yx ee ) 一 一 和 (Z| ,XT; ) ,将 问题 转化 为 求解 


min y(zi 72) 一 一 (6 一 all — awr: rie — Cc) 


— (band ANT re Wn = Cy ) ys (29) 
为 确定 计算 过 程 的 初始 值 , 先 忽略 成 本 ,并 令 价 格 中 的 较 小 的 系数 ws 和 as 等于零， 
问题 简化 为 求 
zi = (bi — anzi)ri tt (bs — a Ts ) rs (30) 
的 极 值 ,显然 其 解 为 zi 二 61/2an ,zs 一 各 /2az ,我 们 用 它 作 为 原 问 题 的 初始 值 ， 
设 定 如 下 一 组 数据 : 6 二 100,ayn 一 1,as 一 0.1, 久 一 280,al 一 0.2,az 一 2, 关 一 30， 
1 二 0. 015,c 一 20, 盖 一 100, 一 0.02,cs 一 30, 编 程 计算 ， 
function y= fun(x) 


y1=((100 一 x(1) 一 0.1x*X(2)) 一 (30* exp( 一 0.015* x(1))+20)) x x(1); 
y2=((280—0.2xxC1)—2xx(2))— (100 x exp(—0,02xxC2))+ 30)) x x(2); 


y= yl~y2; 


x0=[50,70]; 
[x,y]=fminunc( @fun, x0), 


ZY 


x=23.9025 62.4977 z = 6.4135e+ 003 
即 甲 的 产量 为 23. 9025 , 乙 的 产量 为 62. 4977, 最 大 利润 为 6413. 5. 


7.3.9 飞机 的 精确 定位 ( 续 ) 
为 了 求解 7.1. 2 小 节 的 无 约束 最 小 二 乘 拟 合 问题 (6) ,编写 如 下 函数 M 文件 ， 


function f= shili02fun(x, x0, y0 , theta ,sigma, d4 ,sigma4) 
for i=1:3 
fC()=(atan2(x(1) ~ x0 ,x(2) — y0()) ~ theta(i))/sigmali); 
end 
1(4)= (sqgrt( (x(1)—x0C(4))°2+ (xC2) 一 y0(4))"2) — d4)/sigmad; 


代入 所 给 数据 作 如 下 计算 : 


ed 
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Xx=[746 629 1571 155]; 
Y=[1393 375 259 987]; 


theta=[161.2,45.1,309.0—360] x* 2 x pi/360; % 角度 转换 
sigma=[0.8,0.6,1.3]*2x pi/360; 

d4= 864.3; 

sigma4=2; 

x0=[900,700]; % 初 值 


[x,norm,res,exit,out]= lsqnonlin( @ shili02fun,x0,[],[],[],X,Y,theta,sigma,d4,sigma4) 


x =[978. 3070,723.9838] 
norm 三 0.6685 
res =[—0.4361 一 0.1225 一 0.6807 0.0007] 


即 飞机 的 坐标 为 (978. 3070,723. 9838) ,误差 的 平方 和 为 0. 6685. 
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实验 目的 

1. 掌握 Matlab 优化 工具 箱 的 基本 用 法 ,对 不 同 算法 进行 初步 分 析 .比较 . 

2. 练习 用 无 约束 优化 方法 建立 和 求解 实际 问题 的 模型 (包括 非 线性 最 小 二 乘 拟 合 ). 

1. 取 不 同 的 初 值 计算 下 列 平方 和 形式 的 非 线性 规划 , 尽 可 能 求 出 所 有 局 部 极 小 点 ， 
进而 找 出 全 局 极 小 点 ,并 对 不 同 算法 (搜索 方向 、 搜 索 步 长 .数值 梯度 与 分 析 梯 度 等 ) 的 结 
果 进 行 分 析 .比较 . 

(1) min(〔( 好 十 zs 一 11)2 十 (zi 十 好 一 7)2. 

(2) min (xz 十 12z: 一 1)2 十 (49z? 十 49z3 十 84zi 十 2324xzs 一 681)?. 

(3) min (zi 十 10zz) 十 5(z3 一 7) 十 (zz 一 2z3 姓 十 10(Czi 一) 

(4) min 100{Lzs 一 100(ziy7za) 下 十 [十 2 一 1] 十 zx, 其 中 


ela )s Zl 盖 0， 
区 
Ox ,XT2 ) = 


seta a ay 十 人 xi < 0. 
2 2 


2. 取 不 同 的 初 值 计算 下 列 非 线性 规划 , 尽 可 能 求 出 所 有 局 部 极 小 点 ,进而 找 出 全 局 
极 小 点 ,并 对 不 同 算法 (搜索 方向 .搜索 步 长 .数值 梯度 与 分 析 梯 度 等 ) 的 结果 进行 分 析 、、 
比较 ， 


(1) min zx 一 (zyzz)2 (1—x) [lr — rl— x) 1:. 


(2) min z=e "1 (2z 十 3x3). 
0. 04 
一 0. 25xf 一 x 十 1 
1 1 

(x—a) T(x—a)te (Cx 一 ap )ICx 一 0 ) 十 ci 
其 中 (clycs) 一 (0.7,0.73),a 一 (4,4)7，az 一 (2.5,3.8)7. 

3. 如 图 7.4 所 示 ,一 个 简单 的 电路 由 3 个 固定 电阻 Ri ,Ri ,Rs 和 一 个 可 调 电 阻 R, 组 
成 ,其 中 V=80V, R=8Q,Rs 一 120,R; 二 100Q. 如 何 调整 可 调 电阻 R. ,才能 使 该 电阻 消 
耗 的 能 量 尽 量 大 ? 讨论 当 电 压 立 在 45V 一 105V 之 间 变 化 时 ,该 最 大 能 量 和 对 应 的 电阻 
如 何 变化 ? 如 果 R; 和 有 R。 都 是 可 调 电 阻 , 如 何 调整 这 两 个 可 调 电 阻 使 它们 消耗 的 总 能 量 
尽量 大 ? 


(3) min zx 一 (zi 一 2) 十 (zy 一 1) 十 十 5(zi 一 2zs 十 1) 2. 


(4) min > 一 一 xER’, 


图 7.4 第 3 题 图 


4， 某 海岛 上 有 12 个 主要 的 居民 点 ,每 个 居民 点 的 位 置 (用 平面 坐标 +，y 表示 ,距离 
单位 : km) 和 居住 的 人 数 RR 如 表 7.7 所 示 . 现在 准备 在 岛 上 建 一 个 服务 中 心 为 居民 提供 
各 种 服务 ,那么 服务 中 心 应 该 建 在 何 处 ? 


5. 茶 分 子 由 25 个 原子 组 成 ,并 且 已 经 通过 实验 测量 得 到 了 其 中 茶 些 原子 对 之 闻 的 


距离 (假设 在 平面 结构 上 讨论 ), 如 表 7.8 所 示 . 请 你 确定 每 个 原子 的 位 置 关 系 ， 
6， 有 一 组 数据 (ti, yi) (i 二 1,…,33) ,其 中 二 10(i 一 1),y, 由 表 7.9 给 出 . 现 要 用 这 
组 数据 拟 合 函 数 


fxst)=r 二 re 2 十 Toe 55 
中 的 参数 *, 初 值 可 选 为 (0， 5,1.5, 一 1,0.01,0.02), 用 GN 和 LM 两 种 方法 求解 .对 yw 作 
一 扰动 , 即 y; 十 ei,e; 为 (一 0.05,0.05) 内 的 随机 数 : 观 察 并 分 析 和 迭代 收敛 是 否 会 变 慢 . 
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表 7.8 
原子 对 原子 对 距离 原子 对 距离 原子 对 距离 
| 
(4,1) (5,4) 0.4758 || (18,8) 0.8363 | 0c15,13) | 0.5725 
(1234) 1.3402 | (13,9) | 0.3208 | (19,13) | 0.7660 
(13,1) (24,4) 0.7006 || (15,9) 0.1574 | (15,14) | 0.4394 
(17,1) 1. 3765 (8,6) 0.4945. | (22,9) 1.2736 | (16,14) | 1.0952 
(21,1) (13,6) | 1.0559 | il,10) | 0.5781 | ‘20,16) | 1.0422 
(5,2) 0. 5294 (19,6) 0.6810 | (13,10) | 0.9254 | (23,16) | 1.8255 
(16,2) 0. 6144 (25,6) | 0. 3587 (19,10) | 0.6401 | (18,17) | 1.4325 
(17,2) | 0.3766 (8,7) 0.3351 | (20,10) | 0.2467 | (19,17) | 1.0851 
(14,7) 0.2878 | (22,10) | 0.4727 |‖ (20,19) | 0.4995 
| 6,7) 1.1346 |‖ (18,11) | 1.3840 | (23,19) | 1.2277 
(20,3) 0.8000 | 20,7) 0.3870 | (25,11) | 0.4366 | (24,19) | 1.1271 
(21,3) 1. 1090 (21,7) 0.7511 | (15,12) | 1.0307 | (23,21) | 0.7060 
(24,3) 1. 1432 (14,8) 0.4439 | (17,12) | 1.3904 | (23,22) | 0.8052 
表 7.9 
i yi i yi i Yi 
1 0. 844 12 0.718 23 0.478 
2 0. 908 13 0. 685 24 | 0.467 
3 0. 932 14 0. 658 25 0.457 
4 0. 936 15 | 0.628 26 0. 448 
5 0. 925 16 0. 603 27 0. 438 
， 0.908 | 0. 580 28 0. 431 
7 0. 881 0. 558 29 0. 424 
8 0. 850 0. 538 30 0. 420 
9 0. 818 0. 522 31 0.414 
10 0.784 21 0. 506 32 0.411 
11 0.751 22 0. 490 33 0. 406 


7. 经 济 学 中 著名 的 Cobb-Douglas 生产 函数 的 一 般 形式 为 


Q(K,L) = aK°Ls, 


0<~<Za,p=1 


其 中 Q,K,L 分 别 表示 产值 资金 、 劳 动力 ,; 式 中 4,B,a 要 由 经 济 统计 数据 确定 . 现 有 《中 国 
统计 年 鉴 (2003)》 给 出 的 统计 数据 如 表 7. 10 ,请 用 非 线性 最 小 二 乘 拟 合 求 出 式 中 的 a,8， 
a, 并 解释 a,8 的 含义 . 
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表 7.10 
年 份 总 产值 /万 亿 沁 资金 /万 亿 元 劳动 力 / 亿 人 
1984 0.7171 0.0910 4.8179 
1985 0. 8964 0. 2543 4. 9873 
1986 ”1.0202 0.3121 5. 1282 
1987 1. 1962 0. 3792 5. 2783 
1988 1. 4928 0. 4754 5. 4334 
0 
1990 0 
1991 0 
1992 2. 6638 0. 8080 6. 6152 
1993 3. 4634 1. 3072 6. 6808 
1994 4. 6759 1.7042 6.7455 
1995 5. 8478 2. 0019 6. 8065 
1996 6.7885 2.2914 | . 6. 8950 
1997 7. 4463 — 2. 4941 6. 9820 
1998 7. 8345 2. 8406 7. 0637 
1999 8. 2068 2.9854 7. 1394 
2000 | | 9. 9468 3. 2918 7. 2085 
2001 9. 7315 3.7314 | 7. 3025 
2002 10. 4791 4. 3500 7. 3740 


其 中 总 产值 取 自 “国内 生产 总 值 ”, 资 金 取 自 “ 固 定 资产 投资 ", 劳 动力 取 自 “就 业 人 员 ”. 

8， 给 药方 案 设计 需要 依据 药物 吸收 与 排除 过 程 的 原理 . 药物 进入 机 体 后 随 血 液 输送 
到 全 身 ,不 断 地 被 吸收 .分布 .代谢 ,最 终 排出 体外 . 药物 在 血液 中 的 浓度 , 即 单位 体积 血液 
中 的 药物 含量 , 称 血 药 浓度 . 在 最 简单 的 一 室 模型 中 ,将 整个 机 体 看 作 一 个 房 室 , 称 中 心 
室 , 室 内 的 血 药 浓度 是 均匀 的 . 这 里 我 们 用 一 室 模型 ,讨论 在 口服 给 药方 式 下 血 药 浓度 的 
变化 规律 ,及 根据 实验 数据 拟 合 参数 的 方法 . 

口服 给 药方 式 相当 于 先 有 一 个 将 药物 从 肠胃 
吸收 入 血液 的 过 程 ,这 个 过 程 可 简化 为 在 药物 进入 
中 心室 之 前 有 一 个 吸收 室 ( 如 图 7. 5 所 示 ), 记 中 心 
室 和 吸收 室 的 容积 分 别 为 V,Vi, 而 1 时 刻 的 血 药 浓 
度 分 别 为 c(D ,c Co; 中 心室 的 排除 速率 为 &, 吸 收 
速率 为 (这 里 和 ,分 别 是 中 心室 和 吸收 室 血 药 


图 7.5 口服 给 药方 式 下 的 一 室 模型 
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浓度 变化 率 与 浓度 本 身 的 比例 系数 ). 设 上 一 0 时 刻 口服 剂量 为 4 的 药物 ,容易 写 出 吸收 室 
的 血 药 浓度 c1(z) 的 微分 方程 为 


de 
各 
dad 
(0) = 一 
Ci Vi 


中 心室 血 药 浓 度 c(z) 的 变化 率 由 两 部 分 组 成 : 与 c 成 正比 的 排除 (比例 系数 有 ) ;与 c 
成 正比 的 吸收 (比例 系数 局 ). 
再 考虑 到 中 心室 和 吸收 室 的 容积 分 别 为 V ,Vi ,得 到 c(z) 的 微分 方程 为 


dc _ Vi 
下 kc 十 Ve 
c(0) = 0. 
由 以 上 两 个 微分 方程 不 难 解 出 中 心室 血 药 浓 度 
a ki Wer 2 = 
‘DD) = 六 ee e 1’). 


在 制定 给 药方 案 时 必须 知道 这 种 药物 的 3 个 参数 有 ,k,b( 二 dq/V) ,实际 中 通常 通过 
实验 数据 确定 . 设 :二 0 时 刻 口服 一 定 剂量 的 药物 , 表 7. 11 是 实验 数据 (2 ,请 由 此 确定 
k,ki,b. 


表 7.11 
t 0, 083 0. 167 0.25 0. 50 0.75 1.0 1.5 
c(t) 10.9 2 35.5 38.4 34.8 
全 全 | 
2 2. 25 3.0 | 4.0 6.0 8.0 10.0 12.0 
cb) 24. 2 23.6 | 15.7 8.2 8.3 2.2 1.8 
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约束 优化 


实验 7 中 我 们 已 经 给 出 了 优化 问题 的 数学 规划 模型 的 一 般 形 式 ( 其 中 min 也 可 以 是 


max): 


min z= f(x), x= (zi,r, 7T) ER’”, (1) 
Ss. t, gi(x) 委 0， i 一 1 ,m. (2) 
并 且 介 绍 了 无 约束 优化 ( 即 只 有 (1) 式 ) 的 基本 解法 , 然而 ,一 个 约束 优化 问题 的 最 优 解 通 


常 在 可 行 域 ( 由 (2) 式 界定 ) 的 边界 上 取得 ,不 能 用 无 约束 优化 的 方法 求解 ,必须 研究 最 优 
解 位 于 可 行 域 边界 时 的 解法 . 当 变 量 数目 n 和 约束 数目 m 较 大 ,或 者 函数 f(x) 和 gi; (x) 
比较 复杂 时 ,通常 使 用 的 是 数值 解法 . 

8. 1 节 给 出 几 个 约束 优化 的 实际 问题 及 其 数学 模型 ,8. 2 节 、8. 3 节 分 别 介绍 线性 规 
划 和 非 线 性 规划 的 基本 解法 ,包括 MATLAB 优化 工具 箱 的 计算 程序 ,8. 4 节 是 8.1 节 问 
题 的 求解 ,8. 5 节 布 置 实验 练习 . 
8.1 实例 及 其 数学 模型 
8.1.1 生产 销售 计划 

问题 ”一 奶 制品 加 工厂 用 牛奶 生产 Al, A; 两 种 普通 奶 制 品 , 和 B, ,Bi 两 种 高 级 奶 制 
品 ,Bi ,Bz 分 别 是 由 A,,A: 深 加 工 开发 得 到 的 .已 知 每 1 桶 牛奶 可 以 在 甲 类 设备 上 用 12h 
加 工 成 3kg Ai ,或 者 在 乙 类 设备 上 用 8h 加 工 成 4kg A; ;深加工 时 ,用 2h 并 花 1.5 元 加 工 
费 , 可 将 1kg Ai 加 工 成 0.8kg Bi ,也 可 将 1kg A: 加 工 成 0.75kg Bi. 根据 市 场 需 求 ,生产 
的 4 种 奶 制品 全 部 能 售 出 , 旦 每 公斤 A ,A; ,Bi ,B, 获 利 分 别 为 12 元 .8 元 .22 元 、16 元. 

现在 加 工厂 每 天 能 得 到 50 桶 生 奶 的 供应 ,每 天 正式 工人 总 的 劳动 时 间 最 多 为 480h， 
并 且 乙 类 设备 和 深加工 设备 的 加 工 能 力 没有 限制 ,但 甲 类 设备 的 数量 相对 较 少 ,每 天 至 多 
能 加 工 100kg Ai. 试 为 该 厂 制 订 一 个 生产 销售 计划 ,使 每 天 的 净利 润 最 大 ,并 讨论 以 下 
问题 : 

(1) 车 投资 15 元 可 以 增加 供应 1 桶 牛奶 ,应 否 作 这 项 投资 ? 
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(2) 若 可 以 聘用 临时 工人 以 增加 劳动 时 间 , 付 给 临时 工人 的 工资 最 多 是 每 小 时 几 元 ? 

(3) 如 果 B, ,B: 的 落 利 经 常 有 10%% 的 波动 ,波动 后 是 否 需要 制订 新 的 生产 销售 计划 ? 

模型 ”这 是 一 个 有 约束 的 优化 问题 ,其 模型 应 包含 决策 变量 .目标 函数 和 约束 条 件 . 

决策 变量 用 以 表述 生产 销售 计划 , 它 并 不 是 惟一 的 ,我 们 设 Ai,A: ,Bi ,B: 每 天 的 销 
售 量 分 别 为 xz; ,zs ,zx3 ,zs(kg). zayzi 也 是 Bi ,Bs 的 产量 . 设 工厂 用 zs (kg) Al 加 工 Bi,zs 
(kg) A: 加 工 Bs (增设 决策 变量 zs ,ze 可 以 使 模型 表达 更 清晰 ). 

目标 函数 是 工厂 每 天 的 净利 润 >, 即 Al,A: ,Bi ,B: 的 获 利之 和 扣除 深加工 费 ,容易 写 
出 < 一 12zl 十 8z: 十 22z3 十 16z, 一 1.5zs 一 1. 5zxe (元 ). 

约束 条 件 

原料 供应 : Ai 每 天 的 产量 为 zi 十 zs(kg) ,用 牛奶 (zi 十 xs)/3( 桶 ) ,As 每 天 的 产量 为 
Za 十 ze(kg), 用 牛奶 (zs 十 ze)/4( 桶 ), 二 者 之 和 不 得 超过 每 天 的 供应 量 50( 桶 ) ; 

劳动 时 间 : 每 天 生产 A，A: 的 时 间 分 别 为 4Cz: 十 zs) 和 2(zs 十 ze) 加工 Bi ,B: 的 时 
间 分 别 为 2zs 和 2ze ,二 者 之 和 不 得 超过 总 的 劳动 时 间 480h; 

设备 能 力 : Ai 每 天 的 产量 zi 十 zs 不 得 超过 甲 类 设备 的 加 工 能力 100(kg); 

加 工 约 束 : 1(kg) A, 加 工 成 0.8(kg) Bi, , 故 zs 一 0. 8zs ;类 似 地 zi 一 0. 75ze ; 

非 负 约束 ; x ,zz ,ZX ,x ,Xs ,Ts 均 为 非 负 . 


由 此 得 如 下 基本 模型 
maxz 一 12z 十 8z; 十 22zis 十 16z 一 1.5zi5 一 1.52z6 (3) 
i (4) 
3 4 5 
4(zl 十 zx) 十 2(zs 十 ze) 十 2zs 十 2ze 委 480， (5) 
Xi 十 zs 帮 100， | (6) 
Za 一 0. 8zs， (7) 
2Z4 = 0.75ze, ' (8) 
ZX1 syT2 Ta syT1 Ls sXe 之 0, (9) 


”显然 ,目标 函数 和 约束 函数 都 是 线性 的 ,这 是 一 个 线性 规划 (linear programming， 
LP) , 求 出 的 最 优 解 将 给 出 使 净利 润 最 大 的 生产 销售 计划 ,要 讨论 的 问题 需 考 虑 参数 的 变 
化 对 最 优 解 和 最 优 值 的 影响 ,一 般 称 为 敏感 性 (或 灵敏 度 ) 分 析 . 


8.1.2 投资 组 合 


问题 ” 某 投资 公司 经 理 欲 将 50 万 元 基金 用 于 股票 投资 ,股票 的 收益 是 随机 的 . 经 过 
慎重 考虑 ,他 从 所 有 上 市 交易 的 股票 中 选择 了 3 种 股票 作为 候选 的 投资 对 象 . 从 统计 数据 
的 分 析 得 到 : 股票 A 每 股 的 年 期 望 收益 为 5 元 ,标准 差 为 2 元 ;股票 B 每 股 的 年 期 望 收益 
为 8 元 ,标准 差 为 6 元 ;股票 C 每 股 的 年 期 望 收益 为 10 元 ,标准 差 也 为 10 元 ;股票 A,B 
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本 
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收益 的 相关 系数 为 5/24 ,股票 A,C 收益 的 相关 系数 为 一 0. 5, 股 票 B,C 收益 的 相关 系数 
为 一 0. 25. 目前 股票 A,B,C 的 市 价 分 兄 为 每 股 20 元 .25 元 .30 元 (关于 随机 变量 的 期 望 、 
标准 差 .相关 系数 等 概念 可 参看 实验 10 或 概率 论 的 教科 书 ). 

(1) 如 果 该 投资 人 期 望 今年 得 到 至 少 20% 的 投资 回报 ,应 如 何 投 资 可 以 使 风险 最 小 
《这 里 用 收益 的 方差 或 标准 差 衡量 风险 )? 

(2) 投资 回报 率 与 风险 的 关系 如 何 ? 

模型 ”用 决策 变量 zi ,xs 和 和 zs 分 别 表示 投资 股票 A,B,C 的 数量 . 国内 股票 通常 以 
“一 手 ”(100 股 ) 为 最 小 单位 出 售 ,所 以 这 里 设 股票 数量 以 100 股 为 单位 . 相应 地 ,期 望 收 
益 以 百 元 为 单位 . 

记 股 票 A,B,C 每 手 ( 百 股 ) 的 收益 分 别 为 S, ,S: 和 S;( 百 元 ) ,根据 题 意 ,，S;(i=1,2， 
3) 是 一 个 随机 变量 ,投资 的 总 收益 S= ziS 十 zz Sz 十 x3S; 也 是 一 个 随机 变量 .用 和 DD 
分 别 表示 随机 变量 的 数学 期 望 各 方差 (标准 差 的 平方 ),r 表示 两 个 随机 变量 的 相关 系 
数 , 则 

ES, = 5, ES, = 8, ES; = 10,DS, = 4, DS, = 36, DS, = 100， 
ris = 5/24, ris =— 0.5,rs 一 一 0. 25， 
用 cov 表示 两 个 随机 变量 的 协 方差 ,根据 概率 论 的 知识 有 
cov (SS = rs VDST VTS = 7X2X6 ~ 2.5， 


cov (Si1,S3) = ra VDS，wWVDS, = 一 0.5X2X10 一 一 10， 
cov (S$, ,9S,) = ra VDS，wVD5S,， = 一 0.25X6 X 10 一 一 15. 
于 是 ,投资 的 总 期 望 收益 为 
Z1 = ES = ziES,+t zx ES, zr ES 一 5zl 8z; 十 10z3. (10) 
用 总 收益 的 标准 差 ( 或 方差 ) 衡 量 投 资 的 风险 . 投资 总 收益 的 方差 为 
Z; = D(xiSi tt xd; zaS;) 
=D(zS1) 十 D(zzSs) 二 D(zxiSs) + 2c0ov(ziS ,ri Ss) 
十 2cov(Czi9i ,T3953) 二 2cov(r Sz ,rs Si) 
一 Z?DS, 十 xiDS, 十 xz;DS; 十 2zixzzcov(Si ,9S，) 
十 2zizicov(9i ,9 ) 十 2zszacov(9， ,93) 
二 4x? 十 36zx? 十 100z; 十 5zixzs 一 20ziza 一 30rzzy， (11) 
实际 上 投资 者 可 能 面临 许多 约束 条 件 , 如 是 否 需 要 将 手头 的 资金 全 部 用 来 购买 股票 ， 
.没有 购买 股票 的 资金 是 否 可 以 存 人 银行 或 做 其 他 投资 ( 存 人 银行 一 般 总 是 获得 没有 风险 
的 固定 回报 率 , 即 利率 ). 我 们 这 里 假设 不 一 定 需要 将 手头 的 资金 全 部 用 来 购买 股票 ,没有 
购买 股票 的 资金 也 闲置 不 用 ,而 只 考虑 可 用 于 投资 的 资金 总 额 的 限制 , 即 
20z 十 25rz; 十 30zs 委 5000， (12) 
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当然 ,还 有 非 负 约束 
ziyzzyza 之 0， (13) 
一 般 来 说 ,投资 人 希望 投资 收益 大 而 风险 小 , 即 2 最 大 且 2Z; 最 小 ,是 一 个 多 目标 优 
化 问题 ,通常 需 转化 为 单 目 标 优化 问题 来 求解 . 
问题 (1) 要 求 投资 收益 率 不 低 于 20%, 即 10 万 元 ,所 以 由 (10) 式 有 
5xzi 十 gx; 十 10xs 之 1000. (14) 
模型 化 为 在 约束 (12) 一 (14) 下 求 投 资 风险 (11) 式 的 最 小 值 , 由 于 约束 仍然 是 线性 的 ,而 目 
标 函 数 (11) 式 是 二 次 函数 ,这 是 最 简单 的 约束 非 线性 规划 , 称 为 二 次 规划 (quadratic 
programming,QP). 
对 于 问题 (2) ,可 以 通过 给 两 个 目标 不 同 的 权重 ,组 合 后 建立 单 目标 优化 模型 . 
我 们 引入 偏好 系数 8(0 委 6 委 1) 表 示 投 资 者 对 收益 和 风险 的 偏好 程度 ,对 目标 2; 和 和 
2 加 权 , 将 目标 函数 表示 为 
min Z 一 62 一 2 一 8(04z 十 36z 十 100z 十 5zizs 一 20zi7zs 
一 30zsz3a) 一 (5zl 十 8zs 十 10zs ). (15) 
当 p=0 时 ,表明 投资 者 是 完全 的 冒险 型 ,不 考虑 风险 ; 当 8 充分 大 时 ,表明 投资 者 是 保守 
型 的 ,希望 规避 风险 ;一 般 的 8 值 表明 了 投资 者 在 收益 最 大 化 和 风险 最 小 化 之 间 的 一 种 折 
中 . 取 不 同 的 偏好 系数 8, 在 约束 (12)~(14) 下 求 (15) 式 的 最 优 解 ,就 可 以 大 致 看 出 投资 
回报 率 与 风险 的 关系 . 


8.1.3 供应 与 选 址 


问题 ” 某 公 司 有 6 个 建筑 工地 要 开工 ,每 个 工地 的 位 置 ( 用 平面 坐标 x，y 表示 ,距离 
单位 : km) 及 水 泥 日 用 量 Q(t) 由 表 8. 1 给 出 . 目前 有 两 个 临时 料 场 位 于 A (5, 1), B (2, 7)， 
日 储量 各 有 20t. 假设 从 料 场 到 工地 之 间 均 有 直线 道路 相连 ,试制 定 每 天 的 供应 计划 , 即 
从 A,B 两 料 场 分 别 向 各 工地 运送 多 少 吨 水 泥 ,使 总 的 吨公里 数 最 小 . 

为 了 进一步 减少 吨公里 数 ,打算 舍弃 两 个 临时 料 场 ,改建 两 个 新 的 ,日 储量 仍 各 为 
20t, 问 应 建 在 何 处 ?节省 的 吨公里 数 有 多 大 ? 
表 8.1 工地 的 位 置 (x, y) 及 水 泥 日 用 量 < 


模型 记 工 地 的 位 置 为 (a; :68;) ,水 泥 日 用 量 为 Qi(i 二 1，,…,6); 料 场 位 置 为 (CR 
日 储量 为 e;(j 二 1,2, 分 别 表示 A,B) ;从 料 场 ;向 工地 i 的 运送 量 为 cf. 这 个 优化 问题 的 


Ue 


a 
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目标 函数 (总 吨公里 数 ) 可 表示 为 
minf = Da V Tj; 一 4 十 (太一 0 (16) 
各 工地 的 日 用 量 必须 满足 ;所以 


2 
Sc =di, i=1,.,6. (17) 
El 
各 料 场 的 运送 量 不 能 超过 日 储量 ,所 以 
ee ij 二 1,2. (18) 
i=1] 


问题 归结 为 在 约束 (17),(18) 及 决策 变量 非 负 的 条 件 下 ,使 (16) 式 最 小 . 当 使 用 临时 料 
场 时 决策 变量 只 有 cf ,是 线性 规划 模型 ; 当 为 新 建 料 场 选 址 时 决策 变量 为 cy 和 xz; ,yj;, 由 于 
目标 函数 f 对 z;,y; 是 非 线 性 的 ,所 以 是 非 线 性 规划 (nonjinear programming,NLP). 


8.2 线性 规划 的 基本 原理 和 解法 


8.2.1 二 维 线性 规划 的 图 解法 


我 们 从 只 有 两 个 变量 时 的 图 解法 和 人手 ,看 一 个 例子 : 
例 1 求解 线性 规划 . 
maxxz 一 3zi 十 < 
St 
Zl — 2x2 委 2， 
3z1 十 2zs 委 14， 
TT Os 
解 ” 如 果 将 前 3 个 约束 条 件 的 不 等 号 改 成 等 号 ,是 平面 上 的 如 下 3 条 直线 : 
Li: zi— Zz 一 一 2， 
L,;: zi — 2x» 一 2， 
L;; 3z1 十 27x; = 14. 
在 平面 上 作 图 后 不 难 判 断 ( 参 见 图 8.1) ,可行 域 是 由 3 条 直线 工 ,Li ,L; 及 坐标 轴 在 第 一 
象限 围 成 的 5 边 形 OQ QQQ; ,其 顶点 的 坐标 可 以 求 出 ,分 别 为 0(00,0) ,Qi (0,2),Q:(2， 
4) ,QC4,1),Q(2,0). 
当 目 标 函 数 zx 一 3zl 十 zs 取 不 同 值 时 ,表示 一 组 平行 直线 ,如 图 8.1 中 过 O,Qi，Q:， 
Q;， Q, 点 的 虚线 ,其 函数 值 z 分 别 为 Zi 一 0, zs 二 2, zs 三 6, zj 二 10, zs 二 13. 由 于 这 组 直 
线 向 右 移 动 时 函数 值 是 增加 的 ( 想 想 为 什么 ) ,所 以 最 优 解 一 定 在 Q, 点 得 到 : zi 二 4,zxz 二 1， 
最 优 值 为 zw 一 zs 二 13. | 
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' = 
\25TZmax 
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1 
上 


图 8.1 例 !1 的 图 解法 


可 以 看 出 ,由 于 线性 规划 的 约束 条 件 和 目标 函数 均 为 线性 函数 ,所 以 对 于 二 维 情 形 ， 
可 行 域 为 直线 组 成 的 凸 多 边 形 ,上 且 标 函数 的 等 值 线 为 直线 ,等 值 线 沿 着 与 其 垂直 的 一 个 方 
向 (法 线 方向 , 即 等 值 线 上 的 点 的 梯度 方向 ) 移 动 时 ,函数 值 是 增加 的 ( 沿 相 反方 向 移动 时 ， 
函数 值 减少 ). 这 样 ,最 优 解 一 定 在 凸 多 边 形 的 某 个 顶点 取得 . 

从 二 维 例子 的 几何 意义 可 以 看 出 ,线性 规划 的 解 还 会 有 下 列 情形 出 现 : 

可 行 域 为 空 集 (如 第 3 个 约束 条 件 改 为 一 3zx1 十 2x; 之 14) ,无 可 行 解 . 

。 可 行 域 无 界 ( 如 将 第 3 个 约束 条 件 去 掉 ) , 则 可 能 无 最 优 解 ( 即 最 优 值 无 界 ). 注意 : 
可 行 域 无 界 时 也 可 能 有 最 优 解 ,如 对 于 例 1 若 目标 为 z 取 极 小 , 则 将 第 3 个 约束 
条 件 去 掉 后 仍 有 最 优 解 . 
最 优 解 在 点 多 边 形 的 -- 条 边 上 取得 (如 第 3 个 约束 条 件 改 为 3z1 十 zx, 三 14,L; 将 
与 目标 函数 的 等 值 线 平行 ) , 则 有 无 穷 多 个 最 优 解 . 


8.2.2 线性 规划 的 单纯 形 算 法 


1. 线性 规划 的 标准 形 
二 维 的 情况 可 以 推广 到 多 维 : 线性 规划 的 可 行 域 是 超 平面 组 成 的 凸 多 面体 ,等 值 线 
是 超 平面 ,最 优 解 在 此 多 面体 的 某 个 顶点 取得 . 是 多 面体 的 顶点 如 何 得 到 呢 ? 在 前 面 的 例 
1 中 ,对 每 个 不 等 式 约束 ,我 们 总 是 考虑 在 第 一 象限 画 出 对 应 的 等 式 所 代表 的 直线 .可 以 
想到 ,为 了 便于 用 线性 代数 的 方法 处 理 .将 约束 条 件 中 的 不 等 式 直 接 化 为 等 式 是 有 好 处 
的 .实际 上 ,每 个 线性 规划 模型 都 可 以 表达 成 如 下 的 等 式 约束 形式 : 
min z= cx 
s.t, 4r = b, (19) 
x 之 10. 
其 中 xz 一 (zyza…yzo)7 是 决策 向 量 ,c= 一 (cc ,…,c,) 是 费用 向 量 ,A 二 (4ay) ,xs (mn) 
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是 约束 和 矩阵 ( 行 满 秩 ) ,5 二 (51 ,6;,… ,6b,)" 是 右 端 项 向 量 ( 可 以 要 求 b 是 非 负 向 量 ). 这 种 
形式 称 为 线性 规划 的 标准 形 . 

一 个 不 是 标准 形式 的 线性 规划 ,可 以 通过 以 下 几 个 等 价 变换 变 成 标准 形 ， 

(1) 如 果 目 标 函 数 是 求 极 大 , 则 利用 max zemin( 一 z) 化 为 求 极 小 . 

(2) 如 果 约 束 条 件 中 有 形 如 4x 志 5b 的 不 等 式 ,可 以 在 不 等 式 左 边 加 入 松弛 变量 
(slack variables) 化 为 等 式 ; 对 于 “4x 之 b” 形 式 的 不 等 式 , 则 可 以 在 不 等 式 左边 减 去 剩余 变 
量 (surplus variables) 化 为 等 式 ( 相 当 于 不 等 式 两 边 同 时 乘 以 一 1, 变 为 “一 Ax 志 一 b” 以 后 
再 同上 处 理 ). 如 例 1 可 增加 一 个 剩余 变量 ( 记 为 xz;) 和 两 个 松弛 变量 ( 记 为 zx ，xzs), 将 3 
个 不 等 式 的 约束 化 为 


一 2 十 zz 十 za 一 2，xa 之 0. 
XI 一 2Xs 十 Xi 一 2， 2 之 0. 
3zxl 十 2z: 十 zi 一 14，.zs 之 0. 
可 见 , 松 弛 变量 和 剩余 变量 只 是 相对 的 ,没有 本 质 区 别 . 
(3) 如 果 某 个 x; 没有 非 负 约束 ,可 令 zx 一 一 节 ; 右 ,如 之 0; 如 果 原 来 约束 为 zj 之 4， 
可 令 5 二 zj 一 4, 帮 之 0. 
约束 条 件 中 增加 松弛 和 剩余 变量 后 ,目标 函数 中 只 需 将 这 些 变量 的 系数 设 定 为 零 即 
可 ,在 例 1 中 为 
一 之 二 一 3Z1 一 X22 十 0。ZX3 十 0，X 十 0。Xs 
2. 基 解 与 基 可 行 解 
在 标准 形式 下 ;可 行 域 ( 凸 多 面体 ) 是 由 等 式 约束 和 非 负 约束 确定 的 . 如 果 m 二 nx， 则 
由 等 式 约束 Ax=b 可 以 直接 解 出 可 行 点 (或 者 判断 无 可 行 解 ) ;一 般 情况 下 mn, 等 式 约 
束 4x 一 志 没 有 惟一 解 , 但 当 指定 x 中 的 (n 一 m) 个 分 量 的 取 值 后 就 可 以 直接 解 出 可 行 点 
(或 者 判断 在 该 指定 下 无 可 行 解 )， 考 虑 到 非 负 约束 也 可 能 代表 可 行 域 的 边界 ,直接 指定 
(n 一 m) 个 分 量 的 值 为 0 是 方便 的 ,如 果 此 时 Ax==b 正 好 有 惟一 解 , 我 们 把 这 个 解 称 为 基 
本 解 (basic solution, 简称 基 解 ). 当 基 解 是 原 问题 的 可 行 解 时 , 称 为 基本 可 行 解 (basic 
feasible solutions, 简称 基 可 行 解 ). 幸运 的 是 ,可 以 证 明基 本 可 行 解 正好 对 应 于 可 行 域 ( 凸 
多 面体 ) 的 顶点 . 
例如 , 例 1 用 标准 形 表示 时 ,约束 和 矩阵 4 和 右 端 项 向 量 b 分 别 是 
一 1 1 1 0 0 
1 —2 0 1 0|=[p: p p:; p pl b= (2,2,14), (20) 
|! 3 20 0 1 
其 中 pl，…,ps 为 4 的 nn 二 5 个 列 向 量 .线性 方程 组 Ax=b 的 基 解 可 以 如 下 得 到 ; 4 的 秩 
m 王 3, 为 了 保证 指定 n 一 m( 二 2) 个 分 量 的 取 值 为 0 后 4x 二 b 有 惟一 解 , 任 取 m( 二 3) 个 线 
性 无 关 的 列 向 量 组 成 基 ( 也 称 基 矩阵 )4s ,其 余 列 向 量 组 成 非 基 4n ,将 4 的 列 向 量 重 排 次 
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序 后 可 写作 4 二 [As AN] ,相应 地 重 排 x 的 分 量 x 一 区 | ,于 是 py 
N 


分 别称 xs ,xn 为 基 变 量 (basic variables) 和 非 基 变量 (nonbasic variables) , 令 非 基 变 量 
xnw 一 0, 解 得 基 变量 xs 一 4z 8( 自 然 ,4s 是 可 逆 和 矩阵 ). 

对 于 例 1 如 取 4s 王 [Lp ps p5] 王 工 单 位 阵 ), 则 xs 一 (zayziyzs) 一 一 (2，2， 
14)T, 而 xn 二 《zxiyz2)' 二 (0,0)', 于 是 x 二 (0,0,2,2,14)7 为 4x 一 的 一 个 基 解 ,图 8.1 
中 它 对 应 O 〇 点 . 

类 似 地 ,车 取 As= 二 [pt ps psj; 则 xs 二 (zi,zx3,Xxs)! 二 4A81b 二 (2,4,8)7,x 二 (2,0,， 
4,0,8)” 也 是 一 个 基 解 ,对 应 图 8. 1 中 的 Q 点 . 

车 取 Asp= 二 [ps ps psj]j; 则 xp= 二 (zz,x3,7xs)'=AB'b=(—1,3,16)',x=(0,—1,3, 
0,16)" 也 是 一 个 基 解 ,对 应 图 8. 1 中 的 Ri 点 ,我们 看 到 ,Ri 点 不 在 可 行 域内 . 

容易 知道 , 例 1 共有 10 个 基 解 ,其 中 5 个 分 别 对 应 可 行 域 (5 边 形 ) 的 5 个 顶点 ,是 基 


可 行 解 . 一 般 地 , 基 解 最 多 有 ”| 一 志 C71 个 ,但 基 可 行 解 的 个 数 则 要 视 具体 问题 
A ml (n—m)! 
而 定 . : 


3. .线性 规划 的 单纯 形 法 的 基本 思路 

美国 数学 家 Dantzig 于 1947 年 提出 的 单纯 形 法 (simplex method) 是 最 早 提出 的 线性 
规划 算法 ,20 世纪 80 年 代 以 前 几乎 是 线性 规划 的 惟一 算法 ,其 基本 思路 是 : 用 迭代 法 从 
一 个 顶点 ( 基 可 行 解 ) 转 换 到 另 一 个 顶点 ( 称 为 一 次 旋转 ) ,每 一 步 转换 只 将 一 个 非 基 变量 
〈 指 一 个 分 量 ) 变 为 基 变量 , 称 为 进 基 , 同 时 将 一 个 基 变量 变 为 非 基 变量 , 称 为 出 基 , 进 基 和 
出 基 的 确定 最 好 能 使 目标 函数 下 降 尽 可 能 快 . 

可 以 看 出 ,实现 这 一 思路 的 算法 要 解决 以 下 问题 : 选取 初始 基 可 行 解 (顶点 ); 判 断 当 
前 顶点 是 否 最 优 ; 确 定 进 基 和 出 基 变 量 ; 防 止 迄 代 过 程 出 现 循环 ;等 等 .单纯 形 法 有 多 种 不 
同 的 变形 和 具体 实现 方式 ,具体 步骤 可 参阅 任何 一 本 有 关 线 性 规划 的 书籍 ,如 参考 文 
献 L3 一 6]. 1 


8.2.3 线性 规划 的 其 他 算法 


20 世纪 80 年 代 人 们 提出 了 一 类 新 的 算法 一 一 内 点 法 (interior point method ). 内 点 | 


算法 也 是 迭代 法 ,但 不 再 从 可 行 域 的 一 个 顶点 转换 到 另 一 个 顶点 ,而 是 直接 从 可 行 域 的 内 
部 通 近 最 优 解 . 虽然 实际 证 明 单 纯 形 法 计算 效果 很 好 ,目前 仍然 经 常 使 用 ,但 理论 上 讲 内 
点 算法 具有 单纯 形 法 所 不 具备 的 一 些 优点 ,尤其 对 于 特别 大 规模 的 问题 (如 变量 规模 上 万 
甚至 达到 十 万 、 百 万 量 级 ) ,使 用 内 点 算法 可 能 更 为 有 效 . 内 点 算法 理论 较为 复杂 ,有 兴趣 
的 读者 请 参看 有 关 的 专门 书籍 ,如 参考 文献 [7]. 

此 外 ,线性 规划 是 二 次 规划 的 一 个 特例 (只 需 令 所 有 二 次 项 系数 为 零 即 可 ) ,因此 也 可 
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以 用 二 次 规划 的 算法 (如 有 效 集 方法 , 详 见 下 节 关 于 二 次 规划 的 介绍 ) 解 线性 规划 . 
8.2.4 .用 MATLAB 优化 工具 箱 解 线性 规划 


1， 基本 用 法 
用 MATLAB 优化 工具 箱 求 解 线 性 规划 时 不 要 求 一 定 化 为 标准 形 ,而 是 要 求 化 为 如 
下 形式 : 
min z= cx 
s.t. 4x 扫 六 ， 
Asx = b,, 
VI 区 R Vy. 
也 就 是 说 ,需要 将 不 等 式 约束 和 等 式 约束 分 开 列 出 ,并 将 决策 变量 的 上 下 界 约束 单独 列 
出 .求解 程序 为 linprog, 其 最 简单 和 最 一 般 的 调用 方式 分 别 是 : 


(21) 


x= linprog(c, A1,b1) 
[x,fv,ef,out,lambda] = linprogCc,A1,b1,A2,b2,vi1,v2,x0,opt) 


其 中 输入 参数 c,A1,b1,A2,b2,v1,v2 如 (21) 式 所 示 ,x0 为 初始 解 ;opt 为 程序 的 各 种 控制 
参数 ,可 以 通过 实验 7 中 介绍 的 optimset 函数 进行 设置 . 当 输 入 参数 列表 中 的 某 个 中 间 输 
人 参数 缺 省 时 , 需 用 方 括号 [占据 其 位 置 ， 

输出 x 为 最 优 解 ,fv 为 最 优 值 ;ef 为 程序 停止 的 标志 ,表示 程序 停止 的 原因 (含义 与 无 
约束 优化 中 介绍 的 相同 ) ;out 是 一 个 结构 变量 ,包括 程序 运行 的 有 关 信 息 , 含 有 3 个 域 ( 具 
体 含义 见 下 面 的 例子 ) ;lambda 也 是 一 个 结构 变量 ,包含 以 下 4 个 域 ,分 别 对 应 于 程序 停 
止 时 相应 约束 的 拉 格 朗 日 乘 子 , 即 : | 


lambda. ineglin % 对 应 于 不 等 式 约束 A1x 志 b, 的 拉 格 朗 日 乘 子 
lambda. eqlin % 对 应 于 等 式 约束 4sx 二 bs 的 拉 格 朗 日 乘 子 
lambda. upper % 对 应 于 上 界 约束 xs 的 拉 格 朗 日 乘 子 
lambda. lower % 对 应 于 下 界 约束 v1 志 x 的 拉 格 朗 日 乘 子 


其 维 数 等 于 约束 条 件 的 个 数 ,其 非 零 分 量 对 应 于 起 作用 的 约束 , 即 等 号 严格 成 立时 的 
约束 . 
例如 ,对 于 例 1 可 如 下 编程 计算 : 


c= —[3,1]; % 加 负 号 将 求 极 大 化 为 求 极 小 
A= [一 1 1 1 一 2;3,2]; 

b=[2,2,14]; 

v1=[0 0]; % 下 界 


[x,f, exitflag, output,lag]= linprogCc, A,b,[j,L],v1) 
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得 到 最 优 解 x 二 (4,1) ,7 一 一 13( 最 大 值 > 二 一 /一 13)，exitflag 二 1 收敛 ), 此 外 


output 三 
iterations : 5 % 壕 代 次 数 
cgiterations ; 0 % PCG 迭代 次 数 (只 在 大 规模 算法 中 有 用 ) 
algorithm : 'large-scale : interior point' % 所 使 用 的 算法 为 内 点 法 

lag = 


ineqlin : [3x1 double] 
eqlin : [0x1 double] 

upper : [2x1 double] 
lower : [2x1 double] 


要 看 lag 的 具体 值 是 多 少 , 如 ineqlin 的 取 值 ,可 以 在 命令 窗口 下 键入 lag. ineqlin 后 按 回 
车 ,显示 : 
0.0000 


0.3750 
0.8750 


即 lag. ineqlin 二 《0,0. 3750,0. 8750) ,第 2, 第 3 分 量 非 零 ,表示 第 2, 第 3 个 约束 是 起 作用 
的 , 即 第 2, 第 3 个 约束 对 于 最 优 解 是 等 式 约束 (在 图 8. 1 中 我 们 已 经 看 到 ,最 优 解 x 二 
(4,1) 是 工 :3 的 交点 ) ;第 1 分 量 为 0 表示 第 1 个 约束 不 起 作用 (查看 lag. lower 可 知 下 
界 约 束 (zi ,xs 写 0) 也 不 起 作用 ) ,它们 对 于 最 优 解 仍 为 严格 不 等 式 约 束 . 至 于 非 零 分 量 数 
值 的 含义 将 在 8.4 节 的 例题 中 介绍 . 

由 于 例 1 中 zi ,zi 这 0 不 起 作用 ,在 程序 里 不 输入 v1, 只 用 x=linprog(c;A,b) 也 可 得 
到 同样 结果 ,但 是 一 般 情形 下 这 样 做 是 不 行 的 . 

2. 算法 选择 . . 

linprog 程序 有 3 种 算法 可 以 选择 : 默认 时 采用 大 规模 算法 (是 一 种 内 点 算法 ); 当 opt 
中 “LargeScale” 参 数 设 置 为 “off* 时 ,采用 中 规模 算法 ,该 模式 下 默认 的 算法 是 二 次 规划 的 
算法 (一 种 有 效 集 (active set) 方法 , 详 见 下 节 关 于 二 次 规划 的 介绍 ); 当 opt 中 
“LargeScale” 参 数 设置 为 “off”, 并 且 “Simplex” 参 数 设置 为 “on” 时 ,采用 单纯 形 算法 .此 
外 ,只 有 有 效 集 方法 可 以 由 用 户 提 供 初 始 解 x0 ,其 他 两 个 算法 则 不 需要 (即使 提供 了 也 会 
被 忽略 ). 

如 对 于 例 1, 可 以 如 下 选择 中 规模 算法 : 


opt1= optimset('largescale', 'off') ; % 有 效 集 方 法 
[x.:f, exitilag, output,lag] = linprogCc, A,b,[L], [1,0], [I,[],opt1) 
opt2 = optimset(opt1, ‘simplex', 'on') ; % 单纯 形 算法 


Lx,f, exitflag, output, lag| = linprogCc, A,b,[j,[],L],[L],[L],opt2) 
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运行 所 得 结果 与 前 面 类 似 , 只 是 此 时 迭代 次 数 更 少 ( 只 有 2 次 ). 需要 提请 读者 注意 的 
是 ,不 要 因此 得 出 “大 规模 算法 比 中 规模 算法 需要 更 多 次 迭代 ”的 结论 ,因为 这 里 的 例子 只 
是 一 个 ”一 2 的 “ 超 小 ”规模 的 例子 . 
此 外 ,linprog 程序 运行 时 首先 会 进行 一 系列 的 预 处 理 ( 例 如 ,把 能 够 直接 从 约束 中 解 
出 来 的 变量 取 值 确定 下 来 ;把 能 够 直接 判断 的 矛盾 约束 报告 出 来 等 ) ;运行 过 程 中 和 结束 
时 可 能 会 给 出 一 些 错 误 或 警告 信息 ,如 无 可 行 解 (infeasible) ,无 有 界 解 (unbounded) 等 . 
例 2 求解 
main zz 一 3zi 十 Za 一 23 
Ss.t。 Zi 十 zz 一 27za 之 2， 
zl 一 2zs 十 Za 之 2， 
3zi 十 2z 一 Za 一 14， 
ZlyZ2y73 之 0. 
解 ”假设 我 们 如 下 输入 : 
c=[3,1,—1];A1=[1,1,—2;1,—2,1];A2=[3,2,— 1]; 
b1=[2,2];b2= 14;v1=[0 0 0]; 
[x,z,exitflag, output, lag| = linprogCc, A1,b1, A2,b2,v1) 
运行 后 ,MATLAB 显示 “该 问题 是 无 界 的 (unbounded)”,exitflag 一 一 1， 
其 实 , 上 面 的 输入 是 错误 的 (忘记 了 委 和 之 的 区 别 ) ,正确 的 输入 应 该 是 : 


[x,z;exittlag,output,lag]=linprog(c, 一 A1, 一 bl1;,A2,b2,v1) 


得 到 的 结果 为 x= (4,2,2),z= 12. 
8.3 带 约 束 非 线性 规划 的 基本 原理 和 解法 


将 优化 模型 (1) ,模型 (2) 更 具体 地 表示 为 如 下 形式 
minz= f(x), x ER" 
s.t, h(x) =0,， i1= 1,2,.,m, (22) 
gi(X) SO0, j= 1,2,,. 
其 中 f,h;,g; 有 非 线性 函数 ,是 带 约束 的 非 线性 规划 (CNLP). 本 节 介 绍 求解 NLP 的 基本 
原理 ,主要 是 最 优 解 的 条 件 , 对 解法 只 作 简 要 讨论 ,并 介绍 算法 的 MATLAB 实现 . 
”我 们 在 多 元 微 积分 中 学 过 ,如 果 只 有 等 式 约束 疡 , 则 可 以 用 拉 格 朗 日 乘 子 法 构造 函 


数 工 Cx,p) = f(x) 十 ph) Cj 为 参数 ) ,化 为 无 约束 优化 问题 ,然后 利用 无 约束 优化 
最 优 解 的 必要 条 件 来 求解 (相当 于 解 非 线性 方程 组 ). 为 简单 起 见 下 面 考虑 只 有 不 等 式 约 
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束 g; 的 情况 , 即 模型 为 
min z= f(x), xER” 


S。t. g(xX) < 0， ] 一 1 2，…，!. 
8.3.1 最 优 解 的 必要 条 件 


1. 有 效 约束 和 非 有 效 约束 
记 可 行 域 为 G; gj (x) 志 0(j 二 1,2,…, 人 ), 设 x 为 可 行 解 , 使 
gi(x)=0, JEJ g(x <0, jg 
gj;(jE J 了) 称 为 有 效 约束 (或 起 作用 约束 ,active constraint) ,gj(j 攻 1) 为 非 有 效 (inactive) 
约束 ,J 称 为 有 效 集 (active set). 模型 (22) 中 的 h(x) (i=1,2,…,m) 当 然 也 是 有 效 约束 . 
2. 可 行 方向 
对 于 xEG 和 一 方向 d, 若 存在 实数 使 x+idaEG(O<A< ho), 称 4 为 x 的 可 行 方 
向 . 意思 是 x 在 d 的 方向 移动 后 , 仍 为 可 行 解 .下面 考察 当 x 位 于 有 效 约束 上 时 可 行 方 向 
的 条 件 . 
x 在 有 效 约束 上 , 即 g;(x) 二 0GEJ) ,将 g; (x 十 Xd) 在 x 作 泰 勒 展开 , 得 
gi(X+NAd) = g;(x) +AVeg; (x) d+ ON?). 


(23) 


只 要 . 
Vgj;(x)'d < 0, (24) 
当 4 足够 小 时 就 有 gj;(x 十 Xd) 志 0, 于 是 x 十 4 EG,d 为 x 的 可 行 方向 . | 
图 8.2 是 /二 3 的 情况 ,G 为 gjCz) 一 00 一 1,2,3) 所 围 区 域 的 内 部 (包括 边界 ) , 若 x 
在 有 效 约 束 上 ,有 g (xzo) 一 0,Vgi(xo) 与 曲线 gi (x) 二 0 正 交 , 且 指 向 C 的 外 部 ,与 
Vv gi(xo) 成 钝 角 的 方向 d 才 是 可 行 方向 ， 


va) 
图 8.2 最 优 解 的 必要 条 件 . 


3. 下 降 方 向 
对 于 xEG 和 和 一 方向 d , 若 存 在 使 f(x 十 XA4) 过 f(x) (0 过 4 过 %0), 称 4 为 x 的 下 降 方 
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向 . 类 似 地 展开 f(x 十 Xd) ,显然 知 
vf(x)Td 一 0， (25) 
d 必 是 下 降 方 向 . 
4. 最 优 解 的 必要 条 件 
若 在 xEG,d 既是 可 行 方向 又 是 下 降 方向 , 则 x 继续 沿 方向 d 移动 时 ,目标 函数 了 将 
减 小 ,于 是 x 不 是 最 优 解 .反之 , 若 x 是 最 优 解 ,就 一 定 不 存在 既 可 行 、 又 下 降 的 方向 .. 因 
此 ,我 们 得 到 结论 : 如 果 最 优 解 x 在 有 效 约束 上 , 即 g; 《x) 二 0G€ 1), 则 一 定 不 存在 d 使 
a a 
vflx)'d =o. 
即 不 存在 与 Vf(x) 和 Vg; (x) 均 成 钝 角 的 方向 . 这 时 Vf(x) 与 一 Vg; (x) 的 关系 可 以 从 

图 8.2 直观 看 出 . 

”图 8.2 中 车 在 最 优 解 x 处 g1，gz 为 有 效 约 东 ,gs 为 非 有 效 约 束 , 目 标 函 数 等 值 线 
了 (x) 二 c 及 c 的 增加 方向 如 虚线 所 示 , 则 VACx) 可 以 表 为 一 Vg; (x) (j 二 1,2) 的 非 负 线性 
组 合 . | 

一 般 地 ,可 以 证 明 最 优 解 的 如 下 必要 条 件 : 若 x 是 模型 (23) 的 局 部 最 优 解 , 了， 
gj(jE]1) 在 x 可 微 ,g;G J 帮 ) 在 x 连续 , 且 Vgj (x)GE J ) 线 性 无 关 , 则 存在 入 ,…, 宇 0 使 


(26) 


i 
VfCx) + DNhivgj Cx) 一 0， (27) 


Ngi(X) =0, j= 1,2,.,L. (28) 

(27) 式 ,(28) 式 称 为 Karush-Kuhn-Tucker 条 件 ( 简 称 KKT 条 件 ) ,满足 KKT 条 件 的 点 x 
称 为 KKT 点 . 简 而 言 之 ,最 优 解 一 定 是 KKT 点 . 

可 以 看 到 ,最 优 解 x 的 必要 条 件 (27) 式 ,(28) 式 表示 : 对 于 有 效 约 束 jE€ 7,g;(x) 二 0， 
V f(x) 可 以 表 为 一 V g;(x) 的 非 负 线 性 组 合 ,线性 组 合 系 数 即 为 A; (之 0) ;而 对 于 不 起 作用 
约束 j J,gj;(x) 了 关 0, 令 二 0, 于 是 4 和 gj(x) 至 少 有 一 个 为 零 , 使 (28) 式 成 立 ,因此 
(28) 式 称 为 互补 松弛 条 件 . 

上 面 的 KKT 条 件 可 以 推广 到 有 等 式 约束 的 模型 (22): 

车 x 是 模型 (22) 的 局 部 最 优 解 ,f, hi， gj;(jE 1) 在 x 可 微 ,gj;(jJ 1) 在 x 连续 , 且 
Vhi(x)，Vg;《x)(j 扎 J) 线性 无 关 , 则 存在 py,… ,py 和 A1，… ,和 之 0 使 


了 一 


be 4 
Vf Devhilx) + DNVvg x) = 0 (29) 
7 一 1 = 


Agj;(X) = 0, j= 1,2,.,L. (30) 

以 上 两 个 必要 条 件 的 严格 证 明 可 以 参看 文献 [2 一 6]. 注意 ; 对 等 式 约束 , 对 应 的 

pi sp 没有 非 负 限制 . 类 似 于 微 积 分 中 等 式 约束 条 件 极 值 的 拉 格 朗 日 乘 子 法 ,如 果 我 
们 对 模型 (22) 构 造 拉 格 朗 日 函数 
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mm 1 
Lxypsh) = fr) Ophilx) + Dy Negi(x), (31) 
5 一 1 j=1 


则 (29) 式 表示 的 正好 是 函数 二 对 x 的 导数 (梯度 ) 等 于 0. 因此 , Cj,4) 通 常 称 为 拉 格 朗 日 
乘 子 . 


8.3.2 二 次 规划 及 有 效 集 方法 
1. 二 次 规划 与 四 二 次 规划 
对 于 二 次 规划 ,目标 函数 是 二 次 函数 ,约束 为 线性 ,模型 的 一 般 形式 为 


1 
(x) 一 二 XTBx 十 cIx 
Gs (32) 


s.t. 4x 扫 六 
其 中 ec,4, 与 线性 规划 相同 , 囊 E 有 "为 对 称 挎 阵 . 特别 地 , 当 五 正定 时 目标 函数 为 凸 函 
数 ,线性 约束 下 可 行 域 又 是 凸 集 ,(32) 式 称 为 凸 二 次 规划 . 直观 地 分 析 一 下 二 维 平面 上 二 
次 函数 极 值 问题 的 简单 特征 ,容易 理解 凸 二 次 规划 有 如 下 良好 的 性 质 : 
， KKT 条 件 不 仅 是 最 优 解 的 必要 条 件 , 而 且 是 充分 条 件 ; 
。 局 部 最 优 解 就 是 全 局 最 优 解 . | 
2. 等 式 约束 下 二 次 规划 的 解法 
如 果 是 等 式 约束 下 的 二 次 规划 , 即 
min f(x) = x" Hx 二 cx 


(33) 
s.t,. Ax = b. 
则 可 以 用 解 条 件 极 值 问 题 的 拉 格 朗 日 乘 子 法 . 此 时 拉 格 朗 日 函数 (31) 简 化 为 
ey De Fx Hx erx+ATlAr—b), ACR". 
令 L(x,%4) 对 x 和 % 的 导数 为 零 ,得 方程 组 
T em— 
(Ce 0， (34) 
Ar—b=0. 


可 解 出 x,4, 其 中 x 即 为 (32) 式 的 KKT 点 (对 凸 二 次 规划 就 是 最 优 解 ). 

由 于 二 次 规划 的 等 式 约束 与 线性 规划 的 等 式 约束 相同 ,因此 你 应 该 能 想到 也 可 以 设 
计 类 似 于 线性 规划 的 解法 . 例如 ,可 以 利用 等 式 约束 消去 一 些 变量 而 将 二 次 规划 变 成 无 约 
束 规划 ,这 种 方法 称 为 消去 法 . 

3. 解 二 次 规划 的 有 效 集 方法 

对 于 存在 不 等 式 约束 的 二 次 规划 (32) 式 ,很 自然 地 想到 可 以 将 非 有 效 约束 去 掉 , 将 有 
效 约束 作为 等 式 约束 ,通过 解 一 系列 等 式 约束 的 二 次 规划 来 实现 不 等 式 约束 的 优化 . 这 种 
方法 称 为 有 效 集 方 法 ,基本 原理 是 : 若 x 为 (32) 式 的 最 优 解 , 则 它 也 是 
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min f(x) = 工 xzTHx 十 crx 
2 (35) 


s.t. ax=b, jE. 
的 最 优 解 ,其 中 a; 是 4 的 第 7 行 (同时 也 是 对 应 约束 的 梯度 ), J) 为 有 效 约束 的 集合 (有 
效 集 ). 反之 , 若 x 为 模型 (32) 的 可 行 解 ,又 是 模型 (35) 的 KKT 点 , 且 相 应 的 乘 子 4) 之 0， 
则 * 为 模型 (32) 的 KKT 点 (因为 对 不 在 有 效 集 J 中 的 约束 , 令 其 相应 的 乘 子 为 零 
即 可 ), 
有 效 集 方法 通过 迭 代 寻 找 模 型 (32) 的 KKT 点 (对 凸 二 次 规划 就 是 最 优 解 )， 基 本 步 
又 为 : 
设 当 前 近 代 点 (是 模型 (32) 的 可 行 解 ) 为 x; (初始 可 行 解 可 以 用 线性 规划 中 寻找 初始 
可 行 解 的 方法 得 到 ) ,该 点 的 有 效 集 记 作 几 ,为 寻求 x 点 的 迭代 方向 4 ,用 乘 子 法 求解 
sr yo se 
2 (36) 
Ss. t. ad 一 0， 7 GE i. 
得 dis CD (EJ). 


成 立 , 则 xx 是 模型 (32) 的 KKT 点 : 返 代 结 束 ; 若 存在 gE J 使 (44.), 过 0, 则 x 不 是 模型 
(32) 的 KKT 点 ,有 效 集 应 去 掉 ge, Ji 二 JAN{(9} ;继续 求解 模型 (36) 进 行 迭代 . 

若 di 关 0; 则 xi1 二 十 di 可 能 不 是 模型 (32) 的 可 行 解 . 此 时 取 xz 二 x 十 di, 在 
xt+1 为 可 行 点 的 条 件 下 确定 di 方向 的 步 长 wk(C0 委 内 委 1). 如 果 a 二 1, 则 令 Jiri 二 J, 直 
接 继 续 求 解 模 型 (36) 进行 迭代 ;否则 若 存 在 p 儿 J 使 ayxiti 王 b,, 则 pp 应 加 入 有 效 集 ， 
J +t1 王 JU {Pp} ,继续 求解 模型 (36) 进 行 迭代 . 

4: 用 MATLAB 优化 工具 箱 解 二 次 规划 

用 .MATLAB 优化 工具 箱 求 解 二 次 规划 时 要 求 化 为 如 下 形式 : 


min > 一 5x Hx 十 cx 


s.1. 4x 雪 Di， (37) 
Asx = b, 9 
V1 XZ ov. 
求解 的 程序 名 为 quadprog, 其 最 简单 和 最 一 般 的 调用 方式 分 别 是 ， 
x= guadprog(H,c,Al,b1) 
[x,fv,ef,out,lag] = quadprog(H,c,A1,b1,A2,b2,v]1,v2,x0,opi) 
除 日 外 ,其 余 参 数 与 解 线性 规划 的 程序 linprog 相同 ,不 再 重 述 . 在 中 等 规模 模式 下 ， 
用 的 是 有 效 集 方法 ;在 大 规模 模式 下 (注意 : 只 有 当 约 束 中 仅 含有 等 式 约束 或 仅 含 有 上 下 
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界 约束 时 才能 使 用 ), 用 的 是 一 种 置信 域 方法 (trust region method) ,这 里 就 不 再 介绍 了 . 
例 3 求解 


min f(xi,x2) = 27x1 — 3x1xs 3x1 一 3zl 十 Za 
s.t, zi 十 2zs 一 3， 
2X1 — XT > 3; 
2 一 3z 委 3， 
zl 之 2,7zs 委 0. 
解 ” 写 成 形 如 (37) 式 的 标准 形式 可 得 


i 


A, = Cly2)3 bs es 35 We [2 一 Inf]， V2 一 [Inf,0]]. 
输入 如 下 : 


H=[4 -3;-3 6]; c=[—3 人; 

Al1=[-2 1;1 —3]; bl=[3 3]; 

A2=[1 2]; b2=3; v1=[2, 一 Infj;i v2=[lInf,0]; 
[x,fv,ef,out,iag] = quadprog(H,c,A1,b1,A2,b2,v1,v2) 


得 到 x ==[3.0000 0.0000], fv =9.0000, ef=1， out( 略 ) ,而 乘 子 lag 为 : 

lag.eqlin= —9,iag. ineqlin= [0.,0],lag.upper= [0,26],lag. lower= [0,0] 
因此 ,只 有 约束 Xl 十 2Xxs 二 3 ;X20 是 有 效 约 束 . 
8. 3.3 市 约束 非 线 性 规划 的 解法 

非 线性 规划 (NLP) 有 很 多 种 解法 ,如 可 行 方向 法 . 罚 函 数 法 、 梯 度 投影 法 等 .这 里 只 
简单 叙述 MATLAB 优化 工具 箱 中 用 的 逐步 二 次 规划 法 (sequential quadratic 
programming,SQP) , 它 被 认为 是 解 NLP 较 有 效 的 方法 . 


1，SQP 方法 的 基本 原理 
用 SQP 解 NLP(22) 的 基本 原理 是 : 对 拉 格 朗 日 函数 (31) , 即 


nm . 
LA) = fx) Dpihi(x) 十 Dg Cx) 
5 一 1 j=1 
用 二 次 函数 近似 上 (x ,4,4) 后 化 为 QP 问题 ,然后 解 一 系列 如 下 形式 的 QP 子 问题 : 
min Fd'Gd + Vf(e) Td 


ee 
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st, Vhi(xi Tdi+h(x) = 0, i= 1,,m, 
; Vgjy(xi) d+ g(x) SCO, j= 1,,/. 
其 中 xi 是 第 & 次 迭代 的 初始 点 ,Gi 是 LCxi,4,4) 的 黑 赛 矩阵 V ?L 的 近似 .由 (38) 式 得 到 
的 最 优 解 ds 取 作 第 & 次 迭代 的 搜索 方向 ,新 的 迭代 点 为 xiti 二 x 十 axd; ,其 中 w 是 按 一 
定 搜索 准则 得 到 的 步 长 . 这 样 ,SQP 包括 3 个 主要 部 分 : 
。 求解 QP 子 问 题 (38); 
。 用 线性 搜索 计算 步 长 ck; 
。 确定 矩阵 Gi 的 迭代 公式 . 
第 1 个 问题 已 经 在 前 面 解 决 ;第 2 个 问题 是 一 维 搜索 ;解决 最 后 一 个 问题 是 设法 利用 
无 约束 优化 中 拟 牛 顿 法 的 BFGS 公式 . 详细 内 容 可 参见 其 他 有 关 书 籍 . 
2. 用 MATLAB 优化 工具 箱 解 带 约 束 非 线性 规划 
用 MATLAB 优化 工具 箱 求解 非 线 性 规划 时 要 求 化 为 如 下 形式 : 


min z = f(x) 
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s.t. ci(x) 过 0,， 
cs (XxX) 一 10， 
Alx bly 
Asx = b,, 
vl 三 xX 忒 V2. 
求解 的 程序 名 为 fmincon, 其 最 简单 和 最 一 般 的 调用 方式 分 别 是 :. 
x 三 fmincon( @f,x0,Al1,b1) . 
[x,fv,ef,out,iag,grad,hess] = fmincon( @f,x0,A1,b]1,A2,b2,v]1,v2,@c,opt,P1,P2,...) 
多 数 参数 与 前 面 介 绍 过 的 类 似 ,只 是 输入 中 可 以 有 参数 P1，P2 等 (它们 是 传 给 函数 
M 文件 f. mm 或 c. m 的 参数 ), 并 且 可 以 输出 x 点 的 梯度 grad 和 黑 塞 矩 阵 hess. 对 于 中 等 
规模 算法 ,用 的 是 SQP 方法 ;对 于 大 规模 算法 (注意 : 只 有 当 约 束 中 仅 含 有 线性 等 式 约束 
或 仅 含 有 上 下 界 约 束 时 才能 使 用 ) ,用 的 是 置信 域 方 法 . 
需要 注意 的 是 : fm 文件 给 出 函数 f, 当 控制 参数 opt. GradObj 二 'on' 时 必须 给 出 f 的 
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梯度 , 当 opt. Hessian='on 时 还 必须 给 出 其 黑 塞 矩 阵 ,一 般 形式 为 
function [f,g,H] = f(x) 
Fe % 目标 基数 
if nargout 之 1 
g=... % 目标 函数 的 梯度 
if nargout 盖 2 
1 % 目标 函数 的 黑 塞 矩阵 


end 


8.3 带 约 束 非 线性 规划 的 基本 原理 和 解法 


m 给 出 非 线性 约束 , 当 opt. GradConstr='on 时 还 给 出 其 梯度 ,一 般 形 式 为 


function [cf,c2,GC1,GC2] = cx) 


cl=... % 非 线 性 不 等 式 约束 
c2 = .…. % 非 线 性 等 式 约束 
if nargout 之 2 : 
GC1 = ... % cl 的 梯度 
, GO2 = ... % c2 的 梯度 
end 
请 看 下 面 的 例子 。 


例 4 分 别 取 初 值 为 (1, 一 1) 和 (一 1,1) ,在 约束 ey 一 Zz 十 1, 5< 委 0,zizz 十 10 之 0， 


Zi 十 Zs 一 1 一 0 下 求解 min en (4z 十 2z3 十 4zizz 十 2zs 十 1). 


解 ” 我 们 分 别 用 不 给 出 梯度 和 给 出 梯度 两 种 方法 来 计算 . 首先 编写 函数 : 


function [fg,H]= exam0804fun(x) % 编写 目标 函数 的 M 文件 ; 
f= expxC1)) x (4 x xC1)°2+2 x xC2)°2+ 4x xC1) x x(2)+2x x(2)+ 1); 
if nargout > 1 % 梯度 ; | 


g(1)=expCxC1)) x (4¥*xC1)°2+2x xC2)"2+ 4xxC1) x xC(2)+8x xC1)+6 x xC(2)+ 1); 
g(2)=exp x1)) * (4x*x(1)+4x*x(2)+2); 
end . 
if nargbut > 2 % 本 题 不 能 使 用 大 规模 算法 ,因此 以 下 输入 的 黑 塞 矩阵 不 会 被 使 用 
H= expCxC1)) x [4x xC1)°2+2x x(2)°2+ 4 x xC1) x x(2)+ 16 x xC1)+ 10 x x(2)+9,4x x(1) 
+4xxC2)+6;4 x*xC1)+4x xC2)+4,4]; 


end 

function [c,ceq,g'geq] = exam0804con(x) % 编写 非 线 性 约束 的 M 文 件 ; 
c=[1.5 十 xC1) x xC(2) 一 x(1) 一 x(2); 一 x(1) x*x(2) 一 10]; % 不 等 式 约束 ; 

ceq 一 X(1)*2 十 X(2) 一 1; % 等 式 约 束 ; 


if nargout > 2 
g=[x(2) 一 1, 一 x(2);x(1) 一 1, 一 xX(1)]; 
geq=[2 x x(1);1]; 


end 

编写 程序 : 

x0=[1, 一 11]; %[ 一 1,1]; ”% 初始 点 ; | 

opt1 = optimset('largescate', 'off', 'Maxlter', 3000, 'MaxFun', 20000) ; % 采用 中 等 规模 算法 模式 
“问题 有 非 线性 等 式 和 不 等 式 约束 ,大 规模 算法 不 能 使 用 ), 给 出 最 大 迭代 次 数 和 函数 最 大 调用 
次 数 : 


[x,fv, ef,out,lag, grad, hess] = fmincon( @exam0804fun, x0, [J,[],[]:[L],[L],[],@exam0804con, 
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optT ) ， 
-—-fc1l,c21=exam0804con(x)，. 
pause 
opt2 = optimset( opt1, 'GradObj', ‘on', 'GradCon', 'on', ‘DerivativeCheck', ‘on') ; 
% 采用 分 析 梯 度 , 比较 分 析 梯 度 与 数值 梯度 的 差异 (还 可 以 验证 分 析 梯 度 的 输入 是 否 正确 ) 
[x,fv, ef, out, lag, grad, hess ] = fmincon( @ exam0804fun, x0, Lj,[L], Cj,[],[],[],@exam0804con, 
opt2)， 
[cl,c2]= exam0804con(x) 


计算 结果 如 表 8. 2 所 示 . 
表 8.2 例 4 的 计算 结果 


初 值 梯度 | 最 优 解 最 优 值 迁 代 次 数 目标 函数 调用 次 数 
01,_1) | 数值 | 《1.3584, 一 0.8452) 13. 7185 5 | 26 
分 析 | (1.3584, 一 0.8452) 13. 7185 5 | 16 
(1 1) | 数值 | 《一 0.1297,1.2828) 5. 4973 3001 | 18832 
分 析 | (一 0.1385,1.2941) 5. 4833 3001 | 12980 


可 以 看 出 ,第 一 ,不 同 的 初 值得 到 不 同 的 结果 : 对 于 初 值 (1, 一 1),5 次 迭代 就 给 出 了 
最 优 解 ,而 对 于 初 值 (一 1,1) ,计算 至 最 大 迭代 次 数 后 终止 ,但 其 结果 是 不 可 行 解 (可 验证 
它 不 满足 问题 的 等 式 约束 ) ,并 且 , 继 续 迭 代 也 无 收敛 的 迹象 . 实际 上 ,如 果 读 者 在 平面 上 
画 出 可 行 域 ,就 可 以 知道 它 是 第 四 象限 的 一 段 抛物 线 , 而 初 值 (1, 一 1) 正好 位 于 第 四 象限 
(虽然 不 是 可 行 解 ), 距 最 优 解 不 远 , 能 得 到 正确 的 结果 是 可 以 理解 的 .一 般 来 说 ,应 尽量 选 
择 靠近 最 优 解 的 点 作为 初 值 . 

第 二 ,是 否 给 出 分 析 梯 度 对 结果 影响 不 大 (计算 过 程 也 显示 分 析 梯 度 与 数值 梯度 的 差 
异 很 小 ) ,但 是 这 不 具有 一 般 性 ,对 于 有 些 问 题 ,是 否 给 出 分 析 梯 度 对 结果 (如 是 否 收敛 、 收 
敛 速度 等 ) 影 响 是 很 大 的 ， 


8.4 实例 的 求解 


8.4.1 生产 销售 计划 ( 续 ) 


将 8.1.1 节 中 建立 的 模型 整理 后 写成 
maxz 一 12zl 十 8z 十 227ri 十 1674 一 1.575 一 1.576 
s,t，4zl 十 3zs 十 4Zz5 十 3xzge 委 600， 
27zi 十 zi 十 3z5 十 2x 和 雪 240， 


Xl 十 Zs < 100， 


8.4 实例 的 求解 


人 0: 8z5 a 0， 
x 一 0.75z = 0， 
293 5 6 之 0. 


编程 计算 如 下 : 


c=[12 8 22 16 一 人 5 二 站 9] 
Ali=[430043;210032;100010]; 

b1= [£600 240 100]; 
A2=[0010—0.80;00010—0.75]; 

b2= [0 0]; 

v1=[000000]; 
[Exyz0,efyout,lagj= linprog( ~ c,Al1,b1, A2,b2 ,v1) 
lag. ineqlin, lag. eglin 


得 到 最 优 解 为 x 二 (0,168,19.2,0，24,0), 最 优 值 为 z = 一 z0 ==1730. 4. 即 每 天 生产 
销售 168(kg) A: 和 19. 2(kg) Bi( 不 出 售 Al ,B;, ) ,可 获 净 利润 1730, 4 元 .为 此 , 需 用 8 桶 
牛奶 加 工 成 24(kg) A ,42 桶 加 工 成 168(kg) As ,并 将 得 到 的 24(kg) Al 全 部 加 工 成 19.2 
(kg) Bi. 

此 外 ,lag. ineqlin 二 (1.58;3.26; 0.00)， 因 此 原料 .劳动 时 间 为 有 效 约束 ,说 明 原 料 
和 劳动 时 间 得 到 了 充分 的 利用 . 读者 自然 要 问 : 拉 格 朗 日 乘 子 非 零 时 ,其 具体 数值 的 大 小 
有 没有 什么 意义 呢 ? 让 我 们 假设 原 约束 中 的 右 端 项 不 是 600 而 是 601, 即 令 程 序 中 


b1=[601 240 100]; 


重新 求解 上 面 的 问题 ,可 以 得 到 新 的 最 大 利润 为 z1 二 1731. 98,， 利润 增加 了 z1 一 z= 
1731. 98 一 1730. 4 一 1. 58 ,正好 等 于 lag. ineqlin(1) 的 数值 ! 这 不 是 偶然 的 ,而 是 来 自 拉 格 
朗 日 乘 子 的 含义 : 拉 格 朗 日 乘 子 表示 的 是 对 应 约束 的 右 端 项 增加 一 个 单位 时 (假设 其 他 
条 件 不 变 ), 目标 函数 的 增加 量 ( 对 最 大 化 问题 ) 或 减少 量 ( 对 最 小 化 问题 ), 由 此 我 们 继续 
讨论 8. 1. 1 小 节 的 几 个 后 续 问题 : 
” “(1) 着 投资 15 元 可 以 增加 供应 1 桶 牛奶 ,应 否 作 这 项 投资 ? 

上 面 的 原料 约束 是 在 原 约束 (4) 两 边 乘 以 12 以 后 的 结果 ,所 以 约束 (4) 的 右 端 项 增加 
一 个 单位 时 ,利润 增加 lag. ineqlin(1) X12 二 1. 58X12 二 18. 96( 元 ), 显然 18. 96 之 15， 因 
此 投资 增加 牛奶 的 供应 量 是 值得 

在 经 济 学 中 ,一 般 把 拉 格 朗 日 乘 子 称 为 影子 价格 ,因为 在 最 大 化 问题 中 它 表 示 资 源 
(约束 条 件 右 端 项 的 值 ) 增 加 一 个 单位 时 效益 的 增加 量 , 可 以 看 作 是 资源 的 潜在 价值 . 必须 
提醒 读者 注意 的 是 : 拉 格 朗 日 乘 子 是 有 一 定 的 适用 范围 的 ,如 当 投 资 增加 的 原料 供应 量 
达到 一 定数 量 后 , 拉 格 朗 日 乘 子 就 不 再 表示 正确 的 影子 价格 了 . 遗憾 的 是 , MATLAB 没 
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有 给 出 这 个 适用 范围 ,有 些 线性 规划 的 软件 (如 实验 9 中 用 到 的 LINDO 和 LINGO 软件 ) 
给 出 了 这 个 适用 范围 . 

(2) 若 可 以 聘用 临时 工人 以 增加 劳动 时 间 : 付 给 临时 工人 的 工资 最 多 是 每 小 时 多 
少 元 ? 

因为 lag. ineqlin(2) 二 3. 26 ,而 时 间 约 束 是 在 原 约束 (5) 两 边 除 以 2 以 后 的 结果 ,所 以 
劳动 时 间 的 影子 价格 应 为 3. 26/2 王 1. 63, 即 单位 劳动 时 间 增 加 的 利润 是 1. 63, 因 此 付 给 
临时 工人 的 工资 最 多 是 每 小 时 1. 63( 元 ). 同上 所 述 ,劳动 时 间 也 不 能 无 限制 增加 ， 

(3) 如 果 Bi ,Bs 的 获 利 经 常 有 10% 的 波动 ,波动 后 是 否 需 要 重新 制订 新 的 生产 销售 
计划 ? 

车 每 公斤 B; 的 获 利 下 降 10%, 应 将 原 模型 (3) 式 中 zs 的 系数 改 为 19. 8 ,重新 计算 ,可 
以 发 现 最 优 解 和 最 优 值 均 发 生 了 变化 . 类 似 计 算 可 知 , 若 B: 的 获 利 向 上 波动 10% 时 ,上 面 
得 到 的 生产 销售 计划 也 不 再 是 最 优 的 . 这 就 是 说 ,( 最 优 ) 生 产 计 划 对 Bi 或 B, 获 利 的 波动 
是 很 敏感 的 . 实际 上 ,这 相当 于 要 求 确定 最 优 解 不 变 条 件 下 目标 函数 系数 的 允许 变化 范围 
是 多 少 . 同样 ,MATLAB 没有 给 出 这 种 敏感 性 分 析 的 结果 ,而 LINDO 和 LINGO 软件 给 
出 了 这 个 允许 变化 范围 . 


8.4.2 投资 组 合 ( 续 ) 
对 8.1.2 小 节 的 问题 人 1) 建立 的 二 次 规划 模型 (11) 一 (14) ,容易 编写 如 下 程序 : 


HO=[8 5 ~20;5 72 一 30; 一 20 一 30 200]; 
A=[20 25 30;~—5 ~8 一 10]; 

b=[5000 一 1000]; 

x= quadprog(H0 ,[0 0 0],A,b) 


解 得 x = 1.0e+002 x (1.3111,0.1529,0.2221) ,如 果 一 定 要 整数 解 ,可 以 四 省 五 


人 到 (131,15,22). 另 一 种 得 到 整数 最 优 解 的 方法 是 用 实验 9 中 介绍 的 整数 规划 ,如 利用 


LINDO( 或 LINGO) 软 件 可 以 得 到 整数 最 优 解 x 二 132 ,zs 二 15 ,zs 二 22, 即 该 投资 人 应 投 
资 股票 A,B,C 的 数量 分 别 为 132、15 和 22( 手 ), 所 用 去 的 资金 为 132X20 十 15X25 十 
22X30 = 3675( 百 元 ) ,期 望 收益 为 132X5 十 15X8 十 22X10 = 1000( 百 元 ) ,此 时 的 风险 
(方差 ) 为 68116 ,标准 差 ( 均 方差 ) 约 为 261( 百 元 ). 

对 8.1.2 小 节 的 问题 (2 建立 的 模型 (12) 一 (15) ,我 们 取 不 同 的 8 值 计 算出 所 对 应 的 
最 优 投资 方案 ,从 而 以 表格 或 图 形 形 式 给 出 对 应 的 期 望 收益 与 风险 ( 均 方 差 ) 之 间 的 关系 . 
可 以 编写 如 下 程序 : 

HO=[8 5 一 20;5 72 — 30;—20 一 30 200]; 

c=[—5 -8 —10]; 

A=[20 25 30]; 


8.4 实例 的 求解 


b=5000; 
opt= optimset('Large', 'off', 'Display', 'off) ; 
for i= 1 : 1000， 
beta=0.0001*i; 
H= beta * HO; 
x= quadprog(H,c,A,b,[],[],L0,0,0],[L],[L],opt); 
REV() = 一 cx Xi % 计算 期 望 收益 
STD(i) = sqrt(x' x HO x x/2); % 计算 风险 ( 均 方 差 ) 
end : 
pIotCREV ,STD) % 画 预 期 收益 和 均 方差 图 形 
xlabel!(' 预 期 收益 / 百 元 7 
ylabel(' 均 方差 / 百 元 ") 


通过 试探 发 现 8 从 0.0001~0.1 以 0. 0001 的 步 长 变化 就 可 以 得 到 很 好 的 近似 结果 
了 .运行 该 程序 得 到 的 输出 图 形 为 图 8. 3. 


均 方差 / 百 元 


1 1 庄 1 1 


1 
0 200 400 600 800 1000 12001400 1600 1800 
”预期 收益 /再 元 


图 8.3 投资 组 合 的 输出 


从 题目 给 出 的 数据 来 看 ,每 1 元 投资 于 股票 C 的 预期 收益 是 最 大 的 ,因此 50 万 元 可 
能 的 最 大 预期 收益 是 16. 6667 万 元 . 从 图 8. 3 可 以 看 出 , 当 预 期 收益 在 0 一 14 万 元 左右 增 
加 时 ,风险 ( 均 方差 ) 基 本 上 线性 增加 ;车 预期 收益 超过 14 万 元 , 则 风险 ( 均 方 差 ) 迅 速 增 
加 . 由 此 可 知 , 对 于 那些 对 收益 和 风险 没有 特殊 偏好 的 投资 者 来 说 ,转折 点 处 的 投资 组 合 
方案 是 比较 理想 的 ,经 过 对 计算 结果 (数据 输出 ) 的 检查 可 得 ,这 个 方案 大 致 是 投资 股票 
A,B:C 分 别 为 153,35,35( 手 ). 


8.4.3 供应 与 选 址 ( 续 ) 


对 于 8.1.3 小 节 建立 的 模型 (16) ~(18) 用 表 8.1 的 数据 进行 计算 . 
(1) 使 用 两 个 临时 料 场 A (5,1), B (2,7). 求 从 料 场 7 向 工地 i 的 运送 量 cy (一 
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1,… ,6,j 二 1,2), 在 各 工地 用 量 必须 满足 和 各 料 场 运送 量 不 超过 日 储量 的 条 件 下 ,使 目标 
函数 一 一 总 吨公里 数 最 小 . 这 是 一 个 线性 规划 问题 ,计算 结果 如 表 8. 3. 
表 8.3 
i 1 2 3 4 5 6 
cn ( 料 场 A) 


ca( 料 场 B) 


总 吨公里 数 为 136. 2. 
(2) 改建 两 个 新 料 场 . 要 同时 确定 料 场 的 位 置 (xj ,y;) 和 运送 量 cy (i 二 1,…,6,j 二 1， 
2) ,在 同样 条 件 下 使 总 吨公里 数 最 小 . 这 是 一 个 非 线 性 规划 问题 ,目标 函数 编程 如 下 : 


function f= shili083fun( x) 
a=[1.25,8.75,0.5,5.75,3,7.25]; 
b=[1.25,0.75,4.75,5,6.5,7.75]; 
% x(1: 6) : quantity from (xC13), xC14)) to (a(i) ,b(D)) 
%.x(7 : 12) : quantity from (x(15)，x(16)) to (a(i) ,b(D)) 
f= 0; 
fori=1:6 
dl= sqrt((x(13)—a(D))°2+ (x(14) —b())°2); 
d2= sqrt((x(15)—a())*2+ (x(16) ~—b())°2); 
f=dlxx()+d2x x(it+6)+f; 


end 
计算 程序 如 下 (请 特别 注意 线性 约束 的 表达 方法 ): 


format short 
% LOCATION 1 : (x(13),x(14)), quantity from 1 : xC1 : 6) 
% LOCATION 2 : (x(15),x(16)), quantity from 2 : x(7 : 12) 
a=[1.25 8.75 0.5 5.75 3 7.25]; 
b=[1.25 0.75 4.75 5 6.5 7.75]; 
d=[3547611]'; 
e=[20,20]'; 
% Al=[1111110000000000 
% 0000001111110000] 
A1= [ones(1,6) ,zeros(1,10) ;zeros(1,6) ,ones(1,6) ,zeros(1,4)]; 
Bi=e; 
% A2=[1000001000000000 
% 0100000100000000 
% 0010000010000000 


8.4 实例 的 求解 


% 0001000001000000 

% 0000100000100000 

% 0000010000010000] 
A2= [eye(6),eye(6) ,zeros(6,4)]; 


B2=d; 

x0 三 [zeros(1,12) 5 127J]; ”% 取 原 料 场 位 置 为 新 料 场 位 置 的 初 值 
v1= zeros(1,16); 

v2=[d,d,[10,10,10,10]]; 

opt= optimset('LargeScale', "off ‘MaxFunEvals', 4000 ,'Maxlter', 1000); 

[x,f, exitftag, out] = fminconC'shili083fun', x0, A1,B1,A2,B2,v1,v2,[],opt), 


计算 结果 见 表 8. 4. 


表 8.4 


| 新 料 场 位 置 (xz; ，Y;) 
(5.6959 4.9285) 
(7.2500 7.7500) 


总 吨公里 数 为 89.88, 比 使 用 原料 场 减 少 了 46. 32. | 
然而 ,这 并 不 是 惟一 的 局 部 极 小 点 ,也 不 是 全 局 极 小 点 . 如 果 选 择 其 他 初始 值 ,可 能 得 
到 另外 的 局 部 极 小 点 , 请 读者 不 妨 自己 试 试 . 


注意 到 约束 (17) 是 一 个 等 式 约束 , 即 De 三 di(i 二 1,…,6) ,我 们 很 容易 从 中 消去 


一 些 变量 ,从 而 降低 问题 的 维 数 . 例如 ,用 c; 表 示 第 i 个 工地 从 第 1 个 料 场 得 到 的 运送 量 ， 
则 它 从 第 2 个 料 场 得 到 的 运送 量 为 d; 一 ci. 于 是 ,可 以 得 到 如 下 等 价 的 规划 模型 (只 有 10 
个 决策 变量 ): 


min Ycflri mad)! + Cy 6) + (dm— cL maa) + (ys mb) } 


i=1 


Ss. t. (er 1 二 0， 


5 
DEE Ddi—e) <e. 
i=1 


I= 1 


目标 函数 重新 编程 如 下 : 


function f= shili083funl C(x) 
a=[1.25,8.75,0.5,5.75,3,7.25]; 
b=[1.25,0.75,4.75,5,6.5,7.75]; 
demand= [354756 11]; 
% x(1 :6): guantity from (x(7), x(8)) to (a(i),b()) 
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% demand 一 x : quantity from (x(9), x(10)) to (a(i) ,b()) 
f=0; 
for i=1:6 , 
dl= sqrt((x(7) — a(i))“2+ (x(8) —b(0))°2); 
d2= sqrt((x(9) — ali))*2+ (x(10)— b(0))°2); 
f=d1 x x()+ d2 * (demand() —x(i)) +f; 
end 


重新 编写 计算 程序 如 下 


format short “ 
% LOCATION 1 : (x(7),x(8)), quantity from 1 : xC1 : 6) 
% LOCATION 2 : (x(9),x(10)), quantity from 2 : demand— x(1 : 6) 
a=[1.25 8.75 0.5 5.75 37.25]; 
b=[1.25 0.75 4.75 5 6.5 7.75]; 
d=[3547611'; 


e=[20,20]'; | 
% A1=[1000000000 
% 0100000000 
% 0010000000 
% 0001000000 
% 0000100000 
% 00000.10000 
% 1111110000 
9% -1-1-1-1-1=-10000] 


A10= [eye(6);ones(1,6);— 1x ones(1,6)]; 

A1= [A10,zeros(8,4)|]; 

B1= [d;e(1);e(2) — sum(d)]; 

x0=[3x rand(1,6)5127]; ”% 取 原 料 场 位 置 为 新 料 场 位 置 的 初 值 
v1=zeros(1,10): 

v2=[d',[10,10,10,10]]; 

opt= optimset('LargeScale', 'off', ,MaxFunEvals 1000, 'Maxlter', 100) ; 
[x,f,exitflag, out] = fminconC'shili083fun1', x0,A1,B1,[],[],v1,v2,[],opt), 


计算 结果 见 表 8. 5. 


表 8.5 


新 料 场 位置 (x; yy ) 
(3.2549 5.6523) 
《7. 2500 ?7.7500) 


8.5 实验 练习 
总 吨公里 数 为 85. 266, 比 上 面 的 结果 89. 88 减少 了 4. 614 ,而 且 计算 时 间 ( 和 迭代 次 数 ) 也 减 
计算 时 间 来 说 通常 是 有 利 的 . 


8.5 实验 练习 


1. 掌握 用 MATLAB 优化 工具 箱 解 线性 规划 和 非 线 性 规划 的 方法 ; 
2. 练习 建立 实际 问题 的 线性 规划 和 非 线 性 规划 模型 . 
实验 内 容 

2 1 2 


1. (1) 给 定 4= [。 。 1) ,5= (3] ,未 4r=8 的 所 有 基 ( 本 ) 解 及 可 行 域 {z|Az 一 有 ， 


x 之 0} 的 所 有 基 ( 本 ) 可 行 解 . 由 此 回答 : 如 果 在 该 可 行 域 上 考虑 线性 函数 crx, 其 中 ec 一 
(4,1,1)" ,那么 cx 的 最 小 值 和 最 大 值 是 多 少 ? 相应 的 最 小 点 和 最 大 点 分 别 是 什么 ”并 
指出 有 效 约束 . 
(2) 对 于 线性 规划 (opt 可 以 是 min 或 max) 
opt z 一 一 3zi 十 2zs — Xs 
s.t，2zl 十 zz 一 2Zs< 委 5， 
4z1 十 3zy 十 Z 之 3， 
Xi 十 工 2 十 工 3 之 2， 
Xi;sZXi ;Ty 之 0. 
考虑 与 (1) 类 似 的 问题 ，. 
2. 对 于 如 下 线性 规划 问题 (有 3 个 决策 变量 (x,r,s) 和 和 2n 个 约束 ): 
hin (= > 


s.t, 4Z1 一 47 人 1 ， 


zi, 
dx; — xii — 4r; 一 0， 7 25837253755 
4zi 十 ZP 十 45 一 4， 了 一 2 3: 7 
Zi 15 之 0， ] 一 1， 2，……，71， 
请 分 别 对 ”的 不 同 取 值 (如 n= 二 2,10,50 等 ) 求 解 上 述 规划 ,并 观察 和 比较 不 同 算法 


的 计算 效率 . 
3. 对 于 如 下 二 次 规划 问题 (只 有 x 为 决策 变量 ) : 


20 
min 人 0. 5 > Az ee 2)? 
i 二 1 


s.t. Ax bb， x 二 0., 
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已 知 5 二 (一 5,2, 一 1, 一 3,5,4, 一 1,0,9,40)7, 4 为 10X20 的 矩阵 ,47 王 (ay )2oxioy 
且 : ai 一 10 一 1,2，…，20)jiaiz -一 一 3(0 一 13，14，…，21)jaiz- 一 7(2 一 14,15，…，22); 
aiaa-i=0(i=15,16,. ,23) ;ai2s-;=—5(i=16,17,.,24) ;a ;=1(i=17,18,… ,25); 
ai27-i—=1(i=18,19,.,26);ai2;=0(i=19,20,.,27) ;a ;=2(i=20,21,..,28); 
Qi,30-i;=—1(i=21,22,.…,29). 

注意 : 在 上 面 的 表达 中 , 当 a; 中 的 下 标 i 超过 20 时 ,应 理解 为 将 该 下 标 减 去 20( 即 对 
20 取 模 ) ,如 aa.1 一 一 3 的 含义 是 a1.1 二 一 3,azz,s 一 7 的 含义 是 cx: 一 7, 以 此 类 推 ， 

假设 还 已 知 4(i 二 1,2,…,20) 的 取 值 ,请 分 别 对 它 的 不 同 取 伪 ( 如 以 下 两 种 取 值 ) 求 
解 上 述 规划 . - 

(1) Xi=1(i=1,2,. ,20); 

(2) Ai=i(i=1, i “20). 

4, 取 不 同 的 初 信 计算 下 列 非 线性 规划 ， 尽 可 能 求 出 所 有 局 部 极 小 点 上 ,进而 找 出 全 局 
极 小 点 : 

(1) min z=0.000089248zx—0.0218343zx? 十 0. 998266x’ 一 1. 6995x! 十 0, 2x5 

s.t. 0r 志 10. 


(2) min z= cos xisin 
St。 一 1 委 z 委 2， —1<zr,<<l. 
(3) min z 一 一 一 2 
SR 十 25 
<4zi 一 32xi 十 88zi 一 96zl 十 36， 
0 和 zs 委 3， 0 妇 z: 委 4， 
(4y min = Cx = 1 (ra 
s.t, XI 十 ZX 十 xz; 二 3V2 十 2， 
zs 一 ZX? 十 X14 一 2V2 一 2， 
Z12Z5 一 2， 
Cr T123435: 
(5) min z=—25(zx1—2)— (xs —2):— (xs—1)— (x m4):— (rs—1):— (zr —4)’ 
人 二 
(z5 一 3): 十 ze 之 4， 
Zi 一 3zs 魏 2， 
一 ZI 十 Xs 二 2， 
2 委 z 十 z 魏 6， 
0 妇 zi ,zz， 


lr zs 委 5， 
0 委 闪 委 6， 
0 委 ze 委 10. 

5. 对 问题 

min {100(zs 一 妇 )2 十 (1 一 zi)2 十 90(z 一 23)2 十 (1 一 z) 十 10.15(01 一 总 )2 十 (1 一 
24)2] 十 19.8(z 一 1)(z 一 1))} 增 加 以 下 条 件 ， A 1， 
3,1)， 求 解 非 线 性 规划 : 

(1) 一 10 委 zi 委 10; 

(2) 一 10 委 zi 和 甩 10,7zizs 一 业 一 Zi 十 1.5 委 0,2zizs 十 10 之 0, 一 100 委 zzazxzszis 妇 100; 

[3 二 和 0 二 5 
Zi 一 16， 

再 试 取 不 同 的 初 值 或 用 分 析 梯 度 计 算 ,比较 计算 结果 . 你 能 从 中 得 到 什么 启示 ? 

6. 某 市 有 甲乙 、 商 、 丁 四 个 居民 区 ,自来水 由 .A,B,C 三 个 水 库 供应 , 四 个 区 每 天 必 
须 得 到 保证 的 基本 生活 用 水 量 分 别 为 30kt,70kt,10kt,10kt, 由 于 水 源 紧 张 ,三 个 水 库 每 
天 最 多 只 能 分 别 供应 50kt,60kt,50kt 自来水 . 由 于 地 理 位 置 的 差别 , 自来水 公司 从 各 水 
库 向 各 区 送水 所 需 付出 的 引水 管理 费 不 同 ( 见 表 8.6, 其 中 C 水 库 与 本 区 间 没 有 输 水 管 
道 ), 其 他 管理 费用 都 是 450 元 /kt, 根据 公司 规定 ,各 区 用 户 按照 统一 标准 900 元 /kt 收 
费 . 此 外 ,4 个 区 都 向 公司 申请 了 额外 用 水 量 , 分 别 为 每 天 50kt,70kt,20kt,40kt. 该 公司 
应 如 何 分 配 供水 量 , 才 能 获 利 最 多 ? 为 了 增加 供水 量 , 自 来 水 公司 正在 考虑 进行 水 库 改 
造 , 使 三 个 水 库 每 天 的 最 大 供水 量 都 提高 一 倍 , 问 那 时 供水 方案 应 如 何 改 变 ? 公司 利润 可 
增加 到 多 少 ? 


表 8.6 


引水 管理 费 / 元 /kt 
A 220 170 
B 190 150 
C 190 200 230 / 


7. 某 银行 经 理 计划 用 一 笔 资金 进行 有 价 证 券 的 投资 ,可 供 购 进 的 证 券 以 及 其 信用 等 
级 、 到 期 年 限 、 收 益 如 表 8.7 所 示 . 按照 规定 ,市 政 证 券 的 收益 可 以 免税 ,其 他 证 券 的 收益 
需 按 50%% 的 税率 纳税 . 此 外 还 有 以 下 限制 : 

(1) 政府 及 代办 机 构 的 证 券 总 共 至 少 要 购 进 400 万 元 ; 

(2) 所 购 证 券 的 平均 信用 等 级 不 超过 1.4《〈 信 用 等 级 数字 越 小 ,信用 程度 越 高 ); 

(3) 所 购 证 券 的 平均 到 期 年 限 不 超过 5 年 
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表 8.7 
证 券 名 称 证 券 种 类 信用 等 级 到 期 年 限 / 年 到 期 税 前 收益 / % 
A 市 政 2 9 4.3 
B 代办 机 构 2 15 5.4 
C 政府 1 5.0 
D 政府 1 3 4.4 
E 市 政 5 2 4.5 


@ 若 该 经 理 有 1000 万 元 资金 ,应 如 何 投资 ， 

@ 如 果 能 够 以 2.75% 的 利率 借 到 不 超过 100 万 元 资金 ,该 经 理应 如 何 操作 . 

@ 在 1000 万 元 资金 情况 下 , 若 证 券 A 的 税 前 收益 增加 为 4.5%, 投 资 应 否 改变 ? 车 
证 券 C 的 税 前 收益 减少 为 4. 8% ,投资 应 否 改变 

8. 如 图 8.4, 有 若干 工厂 的 排污 口 流入 某 江 ,各 口 有 污水 处 理 站 ,处 理 站 对 面 是 居民 
点 .工厂 1 上 游 江 水 流量 和 污水 浓度 ,国家 标准 规定 的 水 的 污染 浓度 ,以 及 各 个 工厂 的 污 
水 流量 和 污水 浓度 均 已 知道 . 设 污水 处 理 费用 与 污水 处 理 前 后 的 浓度 差 和 污水 流量 成 正 
比 ,使 每 单位 流量 的 污水 下 降 一 个 浓度 单位 需要 的 处 理 费 用 ( 称 处 理 系数 ) 为 已 知 . 处 理 后 
的 污水 与 江水 混合 , 流 到 下 一 个 排污 口 之 前 ,自然 状态 下 的 江水 也 会 使 污水 浓度 降低 一 个 
比例 系数 ( 称 自净 系数 ) ,该 系数 可 以 估计 . 试 确定 各 污水 处 理 站 出 口 的 污水 浓度 ,使 在 符 
合 国家 标准 规定 的 条 件 下 总 的 处 理 费用 最 小 . 


[| TE [i 
| 1 | 


处 理 站 1 处 理 站 2 | 处 理 站 3 
| 


~ OQ 


| 居民 点 1 居民 点 2 | 居民 点 3 


图 8.4 


先 建立 一 般 情况 下 的 数学 模型 ,再 求解 以 下 的 具体 问题 

设 上 游 江水 流量 为 1000(102LVmin) ,污水 浓度 为 0.8(mg/L) ,3 个 工厂 的 污水 流量 
均 为 5(102L/min), 污 水 浓度 (从 上 游 到 下 游 排 列 ) 分 别 为 100,60,50(mg/L) ,人 处理 系数 
均 为 1( 万 元 /((10?*L/min) X 《mg/L))),3 个 工厂 之 间 的 两 段 江面 的 自净 系数 (从 上 游 到 
下 游 ) 分 别 为 0.9 和 0. 6. 国家 标准 规定 水 的 污染 浓度 不 能 超过 1Cmg/L). 

(1) 为 了 使 江面 上 所 有 地 段 的 水 污染 达到 国家 标准 ,最 少 需 要 花费 多 少 费 用 . 

(2) 如 果 只 要 求 3 个 居民 点 上 游 的 水 污染 达到 国家 标准 ,最 少 需要 花费 多 少 费 用 . 
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9. 一 家 糖果 商店 出 售 3 种 不 同 品 牌 的 果 仁 糖 ,每 个 品牌 含有 不 同比 例 的 杏仁 、 核 桃 
仁 、. 腰 果 仁 、 胡 桃仁 . 为 了 维护 商店 的 质量 信誉 ,每 个 品牌 中 所 含有 的 果 仁 的 最 大 、 最 小 比 
例 是 必须 满足 的 ,如 表 8. 8. 所 示 : 

表 8.8 、 

品牌 含量 需求 售 价 / 美 元 /kg 

腰果 仁 不 超过 20% 
胡桃 仁 不 低 于 40% 
核桃 仁 不 超过 25% 
杏仁 没有 限制 
腰果 仁 不 超过 35% 
察 华 杏仁 不 低 于 40% 1. 10 
核桃 仁 .胡桃 仁 没 有 限制 
腰果 仁 含量 位 于 30%% 一 50%% 之 间 
蓝 带 杏仁 不 低 于 30% 1. 80 
核桃 仁 、 胡 桃仁 没有 限制 


表 8.9 列 出 了 商店 从 供应 商 每 周 能 够 得 到 的 每 类 果 仁 的 最 大 数量 和 售 价 . 
表 8.9 


售 价 /美元 /kg . 每 周 最 大 供应 量 /kg 
杏仁 | 0.45 2000 
核桃 仁 0. 55 4000 
腰果 仁 | 0.70 5000 
胡桃 仁 0.50 3000 


商店 希望 确定 每 周 购 进 杏 仁 、 核 桃仁、 腰果 仁 、 胡 桃仁 的 数量 ,使 周 利 润 最 大 . 建立 数 
学 模型 ,帮助 该 商店 管理 人 员 解 决 果 仁 混合 的 问题 . 

10. 某 公 司 将 3 种 木 同 含 硫 量 的 液体 原料 (分 别 记 为 甲乙 、 丙 ) 混 合生 产 两 种 产品 
(分 别 记 为 A,B). 按照 生产 工艺 的 要 求 ,原料 甲乙 必须 首先 倒 入 混合 池 中 混合 ,混合 
的 液体 再 分 别 与 原料 丙 混 合生 产 A,B. 已 知 原料 甲 . 乙 ` 丙 的 含 硫 量 分 别 是 35 ,1%% ,2%， 
进货 价格 分 别 为 6 千 元 /t,16 千 元 /t,10 千 元 /t; 产 品 A,B 的 含 硫 量 分 别 不 能 超过 2, 5%， 
1.5%, 售 价 分 别 为 9 千 元 /t,15 千 元 /t. 根据 市 场 信息 ,原料 甲乙 、 丙 的 供应 量 都 不 能 
过 500t; 产 品 A,B 的 最 大 市 场 需求 量 分 别 为 100t,200t. 

(1) 应 如 何 安排 生产 ? 

(2) 如 果 产 品 A 的 最 大 市 场 需求 量 增 长 为 600t, 应 如 何 安排 生产 ? 

(3) 如 果 乙 的 进货 价格 下 降 为 13 千 元 /t, 应 如 何 安排 生产 ? 分 别 对 (1)、(2) 两 种 情 
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况 进行 讨论 。 
11. 在 如 图 8.5 所 示 的 电网 中 ,需要 从 节点 1 传送 710A 的 电流 到 节点 4. 当 电 流通 
过 电网 传送 时 ,存在 功率 损失 ,而 电流 在 传送 时 将 “自然 而 然 " 地 使 总 功率 损失 达到 最 小 . 


请 根据 这 种 自然 特性 ,确定 流 过 各 个 电阻 的 电流 ,并 与 按照 电路 定律 列 出 的 代数 方程 组 的 
解 相 比 较 . | | 
710A_ 一 10 i L120 | 710A 
49 Se 
图 8.5 


12. 现 有 一 电路 由 3 个 电阻 Ri , Rs ,Rs 并 联 , 再 与 电阻 R, 串 联 而 成 . 记 Ri 上 电流 为 
和 ,电压 为 Vi ,在 下 列 情况 下 确定 R 使 电路 总 功率 损失 最 小 (k= 二 1,2,3,4): 

(1) 1=4,1,=6, 1;=8, 2<V,10; 

(2) Vi=Vs=Vs=6, Vi,=4, 2<IR6. 

13. 某 房地产 开发 商 准备 在 两 片 开 发 区 上 分 别 圈 出 一 块 长 方形 土地 ,并 砌 围墙 将 这 
两 块 土地 分 别 围 起 来 . 每 块 土地 的 面积 不 得 小 于 1000m’ ,围墙 的 高 度 不 能 低 于 2m. 能 够 
用 于 砌 围墙 的 每 块 砖 是 一 样 的 ,每 块 砖 的 高 度 为 10cm, 长 度 为 30cm, 宽度 为 15cm( 假 设 
砖 的 宽度 就 是 围墙 的 宽度 ). 该 开发 商 希 望 用 10 万 块 砖 ,使 圈 出 的 两 块 土地 的 面积 之 和 最 
大 , 问 应 如 何 圈 地 ? 如 果 两 块 土地 不 要 求 是 长 方形 , 而 是 三 角形 ,结果 如 何 ? 
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整数 规划 


在 实验 7 中 我 们 介绍 过 数学 规划 的 一 般 形式 : 
min (或 max) z 一 fx) (1) 
st， gi(xX)0, i=1,2,,m. | (2) 
当 模 型 (1) ,模型 (2) 中 决策 变量 x 的 分 量 xz;(i1 二 1,2,…, n) 中 至 少 有 一 个 只 取 整 数 数值 
时 , 则 该 模型 称 为 整数 规划 (integer programming,IP). 实验 7、 实验 8 中 我 们 介绍 的 都 是 
连续 优化 ,而 这 个 实验 介绍 的 整数 规划 是 组 合 优 化 (离散 优化 ). 
整数 规划 有 不 同 的 分 类 方法 : 当 约 东沙 数 g; (i 一 1,2,…,m) 和 目标 函数 了 都 是 决策 
变量 的 线性 函数 时 , 称 为 线性 整数 规划 ;否则 称 为 非 线 性 整数 规划 . 当 所 有 决策 变量 都 只 
能 在 整数 范围 内 取 值 时 , 称 为 纯 整数 规划 (pure IP,PIP); 若 某 些 决策 变量 可 以 在 实数 范 
围 内 取 值 ,而 另 一 些 决 策 变 量 只 能 在 整数 范围 内 取信 时 , 称 为 混合 整数 规划 (mixed IP， 
MIP). 此 外 , 当 整 数 决策 变量 只 能 取 0 或 1 时 ,相应 的 整数 规划 称 为 0-1 规划 . 
许多 实际 生活 、 生 产 和 管理 中 的 优化 问题 需要 用 整数 规划 来 建 模 , 本 实验 主要 介绍 整 
数 规划 的 一 些 基本 知识 : 9. 1 节 给 出 几 个 可 归结 为 整数 规划 的 实际 问题 及 其 数学 模型 ， 
9. 2 节 介绍 整数 规划 的 基本 原理 和 解法 ,9. 3 节 介 绍 用 优化 软件 包 LINDO 和 LINGO 求 
解 整数 规划 ,9.4 节 是 9.1 节 问 题 的 求解 ,9. 5 节 布 置 实验 练习 . 


9.1 实例 及 其 数学 模型 


9.1.1 选课 方案 


问题 与 模型 ”又 到 了 新 学 期 的 选课 时 间 ,正在 上 大 学 三 年 级 的 小 刚 为 选 什么 课 拿 不 
定 主意 . 由 于 已 经 到 了 高 年 级 ,小 刚 在 这 个 学 期 必须 要 选修 的 课程 (必修 课 ) 只 有 一 门 (2 
个 学 分 ); 但 可 以 供 他 选修 的 限定 选修 课程 ( 限 选课 ) 有 8 门 ,任意 选修 课程 ( 任 选课 ) 有 10 
门 . 由 于 有 些 课程 之 间 相 互 关联 ,所 以 可 能 在 选修 某 门 课 程 时 必须 同时 选修 其 他 某 门 课 
程 , 小 刚 已 经 搜集 到 了 这 18 门 课程 的 学 分 数 和 要 求 同 时 选修 课程 的 相应 信息 如 表 9. 1. 


9.1 实例 及 其 数学 模型 


表 9.1 
二 
限 选 课 课 号 1 2 3 | 1 5 6 7 8 
学 分 5 5 4 4 3 3 | | 

les 

同时 选修 要 求 1 2 fh 
任 选课 课 号 9 10 | 1 | 12 13 | 14 | 15 | 16 17 18 
学 分 de 3 | 2 2 2 1 1 1 1 
同时 选修 要 求 8 6 4 5 7 6 


按照 学 校规 定 , 学 生 每 个 学 期 选修 的 总 学 分 数 不 能 少 于 20 学 分 ,因此 小 刚 必须 在 上 
述 18 门 课程 中 至 少 选修 18 个 学 分 . 学 校 还 规定 学 生 每 学 期 选修 任 选课 的 比例 不 能 少 于 
所 修 总 党 分 数 ( 包 括 2 个 必修 学 分 ) 的 1/6 ,也 不 能 超过 所 修 总 学 分 数 的 1/3. 

小 刚 首 先 问 自 己 :“ 为 了 达到 学 校 的 要 求 , 我 这 学 期 最 少 应 该 选 几 门 课 ? 应 该 选 哪 


几 门 ?” 
想到 自 


己 刚 刚 学 习 过 线性 规划 ,小 刚 马上 考虑 用 线性 规划 来 帮助 解决 选课 问题 . 他 用 


变量 志 ,表示 是 否 选修 课程 1,zi 一 1 为 选修 课程 i,z; 一 0 为 不 选修 课程 1 选修 课程 :时 必 
须 同 时 选修 课程 7”, 则 可 以 用 zj 之 zx; 表示 ;又 用 变量 yi ,yi 分 别 表示 选修 的 限 选课 、 任 选 


课 的 学 分 数 
模型 : 
min 
St 


;y 表示 总 学 分 数 (包括 2 个 必修 学 分 ). 于 是 很 快 就 建立 起 如 下 的 数学 规划 


18 
和 
i=1 
yi 三 5; 十 5zz 十 4zs 十 4z4 十 3zs 十 3X6 十 3x1 十 27X8， 
V2 3Zs 十 3zio 十 32Zn 十 2zia 十 2zis 十 2zl 十 Xis 十 Tie 十 工 17 十 X18: 


y 二 十 yz 十 2， (3) 
> 之 20， > 委 6y， y 之 3yz， 

2Z1 之 Z5， Za 之 T1， Xe 之 Te， Xe 之 zl0， 

Za 之 ZU， Xs 之 Ta， Ti 之 X13， Z6 之 Tia, 

Zi EE {0,1}. 


但 是 上 面 的 模型 (3) 中 要 求 zx; € {0,1), 这 不 是 线性 规划 . 聪明 的 小 刚 想 : 如 果 把 
“zi€ {0,1)” 的 条 件 换 成 “0 志 z; 志 1”, 就 可 以 用 线性 规划 方法 求解 , 于 是 他 将 该 模型 输入 


计算 机 用 线 


性 规划 软件 得 到 的 最 优 解 如 下 : 


Xl Zs Xa Xl 1 ,x3 二 0.0833, zs 一 io 一 0.1111， 其 他 x; 为 0. 

但 是 这 样 得 到 的 x; ,zs 和 zio 为 小 数 ,显然 不 符合 要 求 . 如 果 对 得 到 的 解 进行 四 舍 五 
入 ,小 刚 只 需 选 4 门 课程 (课程 1,2,4,11)17 个 学 分 (不 包括 2 个 必修 学 分 ) ,这 样 选修 的 
课程 和 学 分 都 太 少 了 . 如 果 将 所 有 非 零 变 量 对 应 的 课程 全 选 上 , 他 必须 选 7 门 课程 (加 上 
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课程 3,6,10)27 个 学 分 ,选修 的 课程 和 学 分 显然 太 多 了 . 

上 面 问题 中 决策 变量 只 允许 取 整 数 0 或 1, 称 为 0-1 规划 ,是 特殊 的 整数 规划 . 通过 本 
实验 学 习 后 ,使 用 整数 规划 软件 求解 ,可 以 得 到 这 个 问题 的 一 个 最 优 解 是 z: 二 x 一 
zs 一 Zio 一 Xn 二 1, 其 他 xz; 为 0,y1== 12， ys 二 6,y 二 20. 

读者 可 能 已 经 注意 到 : 这 个 问题 的 最 优 解 不 惟一 .那么 ,在 选修 最 少 学 分 ( 即 20 学 
分 ) 的 情况 下 ,最 多 可 以 选修 多 少 门 课 ? 我 们 将 在 9. 4 节 继 续 讨 论 这 个 问题 的 解法 . 


9.1.2 钢管 下 料 


问题 ” 某 钢 管 零售 商 从 钢管 厂 进 货 ,将 钢管 按照 顾客 要 求 的 长 度 进行 切割 , 称 为 下 
料 . 假定 进货 时 得 到 的 原料 钢管 长 度 都 是 19m. 

(1) 现 有 一 客户 需要 50 根 长 4m、20 根 长 6m 和 15 根 长 8m 的 钢管 . 应 如 何 下 料 最 
节省 ? 

(2) 零售 商 如 果 采 用 的 不 同 切割 模式 太 多 ,将 会 导致 生产 过 程 的 复杂 化 ,从 而 增加 生 
产 和 管理 成 本 ,所 以 该 零售 商 规定 采用 的 不 同 切 割 模式 不 能 超过 3 种 . 此 外 ,该 客户 除 需 
要 (1) 中 的 3 种 钢管 外 ,还 要 10 根 长 5m 的 钢管 . 应 如 何 下 料 最 节省 ? 

问题 分 析 对 于 下 料 问题 首先 要 确定 采用 哪些 切割 模式 . 所 谓 一 个 切割 模式 ,是 指 按 
照 客户 要 求 的 长 度 在 原料 钢管 上 安排 切割 的 一 种 组 合 . 例如 ,我 们 可 以 将 长 19m 的 钢管 
切割 成 3 根 长 4m 的 钢管 , 余 料 为 7m; 或 者 将 长 19m 的 钢管 切割 成 长 tm、6m 和 8m 的 钢 
管 各 1 根 , 余 料 为 1m. 显然 ,可 行 的 切割 模式 是 很 多 的 . 

其 次 ,应当 明 确 哪些 切割 模式 是 合理 的 . 合理 的 切割 模式 通常 还 假设 余 料 不 应 大 于 或 
等 于 客户 需要 钢管 的 最 小 尺寸 . 例如 ,将 长 19m 的 钢管 切割 成 3 根 4m 的 钢管 是 可 行 的 ， 
但 余 料 为 ?7m ,可 以 进 -- 步 将 7m 的 余 料 切割 成 4m 钢管 ( 余 料 为 3m) ,或 者 将 7m 的 余 料 
切割 成 6m 钢管 ( 余 料 为 1m), 经 过 简单 的 计算 可 知 ,问题 (1) 的 合理 切割 模式 一 共有 7 
种 ,如 表 9.2 所 示 . 


表 9.2 钢管 下 料 问题 (1) 的 合理 切割 模式 
模式 4m 钢管 根 数 6m 钢管 根 数 8m 钢管 根 数 余 料 /m 
1 4 0 0 3 
2 3 1 0 1 
3 2 0 i 3 
4 1 2 0 3 
5 1 1 1 | 1 
6 0 3 0 1 
7 0 0 2 3 


于 是 问题 化 为 在 满足 客户 需要 的 条 件 下 ,按照 哪 几 种 合理 的 模式 ,每 种 模式 切割 多 少 


9.1 实例 及 其 数学 模型 


根 原料 钢管 最 为 节省 . 而 所 谓 节 省 ,可 以 有 两 种 标准 ,一 是 切割 后 剩余 的 总 余 料 量 最 小 ,二 


是 切割 原料 钢管 的 总 根 数 最 少 . 下 面 将 对 这 两 个 目标 分 别 讨论 ， 

模型 

问题 (1) 用 zz; 表示 按照 表 9.2 第 i 种 模式 (i 二 1, 2,…, 7) 切 割 的 原料 钢管 的 根 数 ， 
若 以 切割 后 剩余 的 总 余 料 量 最 小 为 目标 , 则 按照 表 9. 2 最 后 一 列 可 得 


min z 一 3ZXl 十 Xz 十 3xs 十 3Xzi 十 Xs 十 Xe 十 3X7 (4) 

车 以 切割 原料 钢管 的 总 根 数 最 少 为 目标 , 则 有 
min zs 一 XI 十 Xz 十 Xs3 十 ZX 十 Xs 十 Xe 十 (5) 

约束 条 件 为 客户 的 需求 ,按照 表 9.2 应 有 
47zi 十 3z;s 十 2zs 十 Zi 十 zs 之 50， (6) 
十 274 十 Zs 十 376 守 20， (7) 
Z3 十 zi 十 2zy 之 15. (8) 


最 后 ,切割 的 原料 钢管 的 根 数 x 显然 应 当 是 非 负 整数 (本 书 中 用 Z 表示 整数 集合 
Z 1 表示 非 负 整数 集合 ): 

Ea = A (9) 

于 是 ,问题 (1) 归 结 为 在 约束 条 件 (6)~(9) 下 ,使 目标 (4) 或 目标 (5) 达 到 最 小 . 显然 这 
是 线性 整数 规划 模型 . 

问题 (2) ”如 果 按 照 问题 (1) 的 办 法 处 理 , 首 先 要 通过 枚 举 法 确定 哪些 切割 模式 是 合 
理 的 ,并 从 中 选 出 不 超过 3 种 模式 . 而 由 于 需求 的 钢管 规格 增加 到 4 种 ,所 以 枚 举 法 的 工 
作 量 较 大 . 下 面 介绍 一 种 带 有 普遍 性 的 方法 ,可 以 同时 确定 切割 模式 和 切割 数量 . 

同 问题 1) 一样 ,只 使 用 合理 的 切割 模式 ,其 余 料 不 应 该 大 于 3m( 因 为 客户 需要 的 钢 
管 的 最 小 尺寸 为 4m, 而 本 题 中 参数 都 是 整数 ). 

由 于 不 同 切割 模式 不 能 超过 3 种 ;可 以 用 xz; 表示 按 照 第 i 种 模式 (i 一 1，2，3) 切 割 的 
原料 钢管 的 根 数 . 又 设 使 用 第 i 种 切割 模式 下 每 根 原 料 钢 管 生产 长 4m,5m,6m 和 8m 的 
钢管 数量 分 别 为 ;rz;， rai, rai. 

我 们 仅 以 使 用 的 原料 总 根 数 最 少 为 目标 , 即 


min zi 二 Xz 十 ws (10) 
满足 客户 需求 的 约束 条 件 为 
rizi rizzz 十 mis7za 之 50， (11) 
razi 十 rzzZz 十 raszs 之 10， (12) 
raX1 十 razxz 十 rsax3 之 20， : (13) 
mlZl 十 rs 十 r4s7sa 之 15. ; (14) 


每 一 种 切割 模式 必须 可 行 、 合 理 ,所 以 每 根 原料 钢管 的 成 品 量 不 能 超过 19m, 也 不 能 少 于 
16m( 余 量 不 能 大 于 3m) ,于 是 
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16 甩 4ru 十 5r 十 6rl 十 8 委 19， (15) 
16 < dr 十 5rs + 6rss + Br < 19, (16) 
16 和 4ris 十 5rzs 十 6r3s 十 8rs 委 19，. (17) 
最 后 ,加 上 非 负 整数 约束 : 
| zy ri EZ+t, i=1,2,3, j=1,2,3,4. (18) 


于 是 ,问题 (2) 归 结 为 在 约束 条 件 (11) 一 (18) 下 , 求 2 和 7 2 Taiy ra(i=1, 2 
使 目标 (10) 达 到 最 小 . 显然 ,这 是 非 线性 整数 规划 模型 . 


9.1.3 生产 批量 计划 


问题 ” 某 工厂 生产 某 种 产品 用 以 满足 市 场 需求 . 通过 统计 ,该 产品 今后 4 周 的 外 部 需 
求 ( 订 货 量 ) 分 别 是 2000 件 .3000 件 .2000 件 和 4000 件 . 如 果 某 一 周 要 开工 生产 , 则 这 一 
周 开工 所 需 的 生产 准备 费 为 3000 元 (与 生产 的 数量 无 关 ) ,每 件 产品 的 生产 费 为 50 元 . 如 
果 在 满足 需求 后 周末 有 产品 剩余 , 每 件 产品 的 存储 费 为 1 元 . 假设 开始 没有 库存 , 且 不 考 
虑 生产 能 力 限制 , 问 工厂 应 如 何 安 排 生 产 , 在 按时 满足 需求 的 条 件 下 使 总 费用 最 小 ? 

模型 ”这 种 生产 计划 通常 称 为 动态 生产 批量 计划 (dynamic lotsizing) ,下面 用 符号 
表示 各 个 已 知 参 数 和 决策 变量 ,建立 一 般 化 的 模型 . 

假设 考虑 工 个 时 段 ( 周 ), 记 时 段 上 的 市 场 需求 为 &a. (一 1,2,…,T), 若 时 段 上 开工 生 
产 ， 则 开工 所 需 的 生产 准备 费 为 % 之 0, 单 件 产品 的 生产 费 为 c: 这 0, 某 时 段 上 末 如 果 有 产 
品 剩余 , 单 件 产品 的 存 贮 费 为 六 之 0， 

假设 时 段 :产品 的 产量 为 x,( 宇 0), 期 末 产 品 的 库存 量 为 I.( 之 0), 且 知 J。 二 0. 引入 
0-1 变量 y, 表示 在 时 段 t 工厂 是 否 进行 生产 准备 Cy, 二 1 表示 进行 准备 ,y% 一 0 表示 不 进 
行 准备 ). 目标 函数 为 包括 准备 费 、 生 产 费 和 存储 费 在 内 的 总 费用 ;问题 可 以 表 为 如 下 的 


模型 ; 
工 
” minz 二 Dy) Csiyst crit hl,) (19) 
t=] 

Sil 了 一 1,2，……， 了 ， (20) 

1， ZT,>0， 
»= | 1 = 1,2,.…,T, (21) 

0， Xx, 一 0， 
了 三 :0 Zi, 了 之 0， i (22) 


当 需 求 量 &, 很 大 时 ,决策 变量 x, 和 了 ,通常 可 以 作为 非 负 实数 处 理 , 只 有 y, 是 整数 0-1 
变量 ,所 以 是 一 个 混合 整数 规划 问题 (具体 地 ,是 混合 0-1 规划 ). 

初 看 起 来 ,注意 到 约束 (21) 是 非 线性 的 ,所 以 这 是 一 个 非 线性 整数 规划 , 不 过 很 容易 
把 约束 (21) 转 化 为 线性 约束 来 处 理 , 实际 上 它 可 以 用 下 面 的 约束 替代 (和 蔡 代 后 的 模型 与 
原 模型 有 相同 的 最 优 解 ) : 
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z, < My, 1 一 1,2,…,T,， (23) 

y € {0,1}, 1 = 1,2,.…,T. (24) 
其 中 M 是 一 个 充分 大 的 正 数 (如 本 题 中 可 以 取 M 为 4 周 需求 的 总 和 , 即 11000 就 足够 
了 ), 这样,(19) 式 ,(20) 式 ,(22) 式 和 (23) 式 ,(24) 式 表示 的 是 一 个 线性 混合 0-1 规划 
模型 . 


9.2 整数 规划 的 基本 原理 和 解法 


一 般 来 说 ,整数 规划 (IP) 间 题 , 即 使 是 线性 整数 规划 的 求解 也 是 非常 困难 的 . 虽然 IP 
的 可 行 解 通常 只 有 有 限 多 个 ,可 以 通过 枚 举 比 较 出 最 优 解 ,但 是 对 于 规模 稍 大 些 的 实际 问 
题 , 枚 举 法 的 计算 量 难以 接受 . 我 们 知道 ,线性 规划 问题 存在 有 效 算 法 ,那么 为 什么 不 先 去 
掉 整 数 限制 ,求解 相应 的 线性 规划 问题 (一 般 称 为 整数 规划 的 线性 规划 松弛 问题 ,或 简称 
LP 松弛 ) ,然后 将 得 到 的 解 四 舍 五 人 到 最 接近 的 整数 呢 ?” 在 有 些 情况 下 ,尤其 当 LP 松弛 
的 解 是 非常 大 的 实数 时 ,如 果 这 些 解 对 舍 人 不 太 敏 感 ,那么 这 一 策略 可 能 是 可 行 的 . 但 在 


许多 实际 应 用 中 ,整数 变量 的 取 值 并 不 太 大 ,特别 是 0-1 规划 问题 ,这 一 方法 往往 行 不 通 ， 


此 外 ,把 LP 松弛 的 解 四 舍 五 人 到 一 个 可 行 的 整数 解 并 非 易 事 ( 见 下 例 ). 
例 1 求解 如 下 IP 模 型; 
-max z= 57zl 十 8zs 
s.t, Xi 十 ZX: 二 6， 
5zl 十 9zs 委 45， 
Zlyza 之 0 且 为 整数 . 
解 模型 (25) 去 掉 整 数 限 制 后 记 作 LP, 其 可 行 域 为 图 9. 1 中 由 点 (0,0)，(6,0)， 
P (2.25,3.75),(0,5) 转 成 的 四 边 形 , 过 PP 点 的 等 值 线 ( 图 中 虚线 ) 为 z 二 zmx ,最 优 解 在 PP 
点 取得 . 图 中 小 圆 点 为 整数 点 ,四 边 形 中 的 小 圆 点 才 是 IP 的 可 行 解 . 


(25) 


oe ~ 
i 
~、9 XI 
Zmax 


图 9.1 整数 规划 例题 图 解 
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将 P 点 舍 入 成 整数 或 者 找 最 靠近 它 的 整数 ,都 得 不 到 IP 的 最 优 解 . 经 在 可 行 解 中 试 
探 .比较 得 到 表 9. 3: 


表 9.3 


最 靠近 PP 的 可 行 解 
(2,3) 
z= 34 


LP 最 优 解 P 
(2.25,3.75) 
之 一 41. 25 


(0,5) 


可 见 IP 最 优 解 不 一 定 能 从 LP 最 优 解 经 过 简单 的 “移动 ”得 到 . 
求解 整数 规划 没有 统一 的 有 效 方法 ,不 同方 法 的 效果 与 问题 的 性 质 有 很 大 关系 . 下 面 
只 介绍 分 枝 定 界 法 和 动态 规划 法 ,它们 可 被 看 作对 枚 举 法 的 改进 . 


9.2. 1 分 枝 定 界 法 


分 枝 定 界 法 (branch and bound) 采 用 “分 而 治 之 "的 策略 求解 整数 规划 ， 其 基本 思想 
是 隐 式 地 枚 举 一 切 可 行 解 . 自然 , 它 不 是 简单 的 完全 枚 举 , 而 是 以 一 种 比较 “聪明 ”的 方式 
进行 的 , 即 逐 次 对 解 空间 进行 划分 . 所 谓 分 枝 , 指 的 就 是 这 个 划分 过 程 ;而 所 谓 定 界 , 是 指 
对 于 每 个 划分 后 的 解 空 间 ( 即 每 个 分 枝 ) ,要 计算 原 问 题 的 最 优 解 的 下 界 ( 对 极 小 化 问题 ). 
这 些 下 界 用 来 在 求解 过 程 中 判定 是 否 需 要 对 目前 的 解 空间 进一步 划分 ,也 就 是 尽 可 能 去 
掉 一 些 明 显 的 非 最 优点 ,从 而 避免 完全 枚 举 . 
分 枝 定 界 算法 的 实际 效果 取决 于 具体 的 分 枝 策略 和 定 界 方法 . 对 于 线性 整数 规划 ， 
定 界 方 法 中 经 常 采 用 的 是 线性 规划 松弛 . 下 面 介绍 这 一 方法 的 基本 思想 . 
对 应 于 线性 规划 的 标准 形 (实验 8 中 的 式 (19)) ,线性 整数 规划 的 标准 形 记 为 
min cT x 
s.t, Ax = b,， 
xx 之 0， 
XEZL" 
其 中 已 知 的 参数 为 cE Z",bEZ",AEZ™"( 一 般 可 以 假定 约束 和 矩 阵 4 是 行 满 秩 的 , 且 
mn,b 之 0; 此 外 ,假设 已 知 参数 4.5,c 的 元 素 是 有 理 数 等 价 于 假设 它们 是 整数 ). 
首先 求解 原 问 题 (26) 的 LP 松弛 , 即 
minc' x 
s.t. Ax = b, (27) 
x 之 0. 
如 果 问 题 (27) 的 最 优 解 x” 恰好 是 整数 (所 有 分 量 都 是 整数 ) , 则 求解 结束 ,x 也 是 式 (26) 
的 最 优 解 . 否则 , 式 (27) 的 最 优 值 只 是 式 (26) 的 最 优 值 的 一 个 下 界 ( 请 思考 为 什么 ). 假 
设 x? 的 某 个 分 量 zx 不 是 整数 , 则 式 (26) 可 以 划分 为 以 下 两 个 子 问题 ( 称 为 “分 校 ”): 


(26) 
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min cx 
s.t. Ax = b, 
x 宇 0， (28) 
ZX: 守 | zx? | 十 1，. 
XED!"; 
min cx 
s.t. Ax = b, 
x 之 0， (29) 
过 Ei 于 
XEZ 
再 对 子 问 题 (28) 和 (29) 继 续 上 述 分 枝 定 界 过 程 . 若 在 某 一 时 刻 , 得 到 一 个 全 整数 解 
( 即 全 部 分 量 均 为 整数 的 解 ) 的 目标 值 为 z , 则 z, 为 式 (26) 的 一 个 上 界 ( 显 然 ,如 果 在 不 同 
分 枝 得 到 了 不 同 的 上 界 ,我 们 只 需要 记 住 其 中 最 好 的 一 个 上 界 , 即 最 小 的 一 个 上 界 值 U). 
此 时 , 若 打算 从 子 问题 & 开 始 分 枝 , 而 这 一 子 问题 的 下 界 为 xz 之 U, 则 这 一 分 校 不 必 再 考 
谍 ( 一 般 称 该 分 枝 “ 被 杀 死 ”或 “已 探 明 ”) ,因为 在 这 一 分 枝 中 不 会 找到 费用 小 于 的 解 . 
如 果 zs 过 U0, 则 分 枝 过 程 还 要 继续 下 去 (一 般 称 该 分 枝 为 “ 活 牙 的 ”(active) 或 该 分 枝 点 为 
“ 活 点 ”). 
根据 上 面 的 介绍 绍 ,分 校 定 界 算法 可 以 形式 地 描述 如 下 : 


te PTT TTT tT TT OO Tot TT tT Te tn nts 


分 枝 定 界 算法 

步骤 40， 令 活 路 分 枝 点 集合 activeset 二 10}; 上 界 U 二 oo0; curtentbest 一 0. 

步骤 1. 如 果 activeset 一 好, 则 已 经 得 到 原 问 题 的 最 优 解 ， 结束; 否则 从 活跃 分 枝 
点 集合 activeset 中 选择 一 个 分 枝 点 &; 将 & 从 activeset 中 去 掉 ， 继 续 步 又 2. 

步骤 2. 生成 & 的 各 分 枝 i 二 1,2,… ,nx 及 其 对 应 的 下 界 zi;. 

步骤 3. 对 分 枝 i 二 1,2,… ,ns: 如 果 分 枝 i 得 到 的 是 全 整数 解 旦 zx; 二 U, 则 令 U= 
zi 且 currentbest 王 i; 如果 分 梳 i 得 到 的 不 是 全 整数 解 且 z; 二 0， 则 把 i 加 入 
activeset 中 ， 


1 


例 2 用 分 校 定 界 法 求解 : 


min 过 一 一 并 一 了 


Ss, ft. 2 元 i 之 


(PO) , 2X1 十 xs 世 
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1 
:之 元， 
9 (30) 
TX1sT2 € 2 
T 

解 问题 (P0) 的 LP 松弛 的 解 为 ma 一 ( 子 ,这 ) ,不 是 整数 解 ,最 优 值 为 x 一 一 4 

U 一 co, 于 是 问题 (P0) 可 以 分 解 为 以 下 两 个 问题 ; 
《(P1):《P0) 加 上 zi 之 2; 


(P2);《P0) 加 上 zz 全 1. 
和 
问题 (P1) 的 LP 松弛 的 解 为 * 一 (2, 郊 ) ,不 是 整数 解 ,最 优 值 为 m 一 一 3. 5. 于 是 


(P1) 可 以 分 解 为 以 下 两 个 问题 ， 
(P3): (P1) 加 上 zz 之 2; 
(P4) : (P1) 加 上 zz 委 1. 


问题 (P3) 的 LP 松弛 无 可 行 解 ， 问题 (P4) 的 LP 松弛 的 解 为 x! 二 (二 ,1】 ,不 是 整数 


解 , 最 优 值 为 x; 二 一 3.25. 于 是 (P4) 可 以 分 解 为 以 下 两 个 问题 ， 
(P5): (P4) 加 上 zi 之 3; 
(PO); (P4) 加 上 三 和 2. 
问题 (P5) 的 LP 松弛 无 可 行 解 . 问题 (P6) 的 LP 松弛 的 解 为 x' = 二 (2,1)?, 是 整数 解 ， 
最 优 值 为 zs 二 一 3. 它 是 当前 找到 的 原 问题 的 一 个 上 界 (U 二 =z 二 一 3). 
再 看 问题 (P2). 问题 (P2) 的 LP 松弛 的 解 为 ?一 (1, 过 ) ,不 是 整数 解 ,最 优 值 为 
zz 二 一 2.5. 由 于 当前 上 和 界 xs 委 z: ,因此 没有 必要 继续 从 间 题 (P2) 进 行 分 枝 ， 
于 是 , 原 问 题 (P0) 的 最 优 解 为 x* = 二 x 二 (2,1)7 ,最 优 值 为 z* 一 zs 一 一 3， 
图 9. 2 是 本 例 的 求解 过 程 示意 图 ,按照 上 述 步骤 把 求解 过 程 走 一 遍 , 对 理解 分 枝 定 界 
法 是 有 帮助 的 ， | 


PO 


图 9.2 分 核定 界 法 求解 过 程 示意 图 
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在 具体 求解 过 程 中 还 有 一 些 更 精细 的 问题 需要 考虑 ,如 选 哪 一 个 非 整 数 解 的 分 量 对 
可 行 域 作 进 一 步 的 分 解 (分 枝 ) ,每 次 分 枝 后 先 检查 哪 一 枝 , 这 些 都 没有 统一 的 原则 . 

上 面 的 方法 可 以 很 容易 地 推广 到 解 非 线性 整数 规划 . 对 应 的 定 界 方法 仍然 可 以 是 连 
续 规 划 松 弛 , 即 解 对 应 的 非 线性 (连续 ) 规 划 . 当然 ,还 存在 其 他 的 “ 定 界 ” 技 术 , 如 拉 格 朗 日 
松弛 方法 等 ,这 里 就 不 多 介绍 了 . 

分 校 定 界 法 希望 通过 “ 定 界 ” 技 术 尽 量 避 免 完 全 榴 举 , 但 为 了 保证 找到 最 优 解 ,又 必须 
隐 式 地 枚 举 一 切 可 行 解 . 在 最 坏 的 情况 下 ,分 枝 到 最 后 的 结果 可 能 等 价 于 完全 枚 举 ,因此 
计算 时 间 可 能 很 长 ,对 大 规模 问题 可 能 无 法 在 可 以 接受 的 计算 时 间 内 得 到 一 个 比较 好 
的 解 . 

如 果 准 备 自己 编写 一 个 分 枝 定 界 算法 求解 整数 规划 ,我 们 提醒 大 家 注意 : 在 没有 整 
数 数据 结构 的 语言 中 ,必须 解决 如 何 判断 一 个 实数 是 整数 的 问题 . 


9.2.2 动态 规划 法 


为 了 说 明 动 态 规划 方法 的 基本 思想 , 先 看 下 面 的 例子 .. 

例 3 最 短路 问题 BE 

在 纵横 交错 的 公路 网 中 (如 图 9. 3 所 示 ) ,货车 司机 希望 找到 一 条 从 一 个 城市 到 另 一 
个 城市 的 最 短路 . 图 中 A ,A; ,… 表 示 货 车 可 以 停靠 的 城市 , 路 线 旁 的 数字 表示 两 个 城市 
之 间 的 距离 ( 百 公里 ). 若 货车 要 从 城市 S 出 发 到 达 城 市 工 , 问 如 何 选择 行驶 路 线 使 所 经 过 
的 路 程 最 短 ? 


图 9.3 最 短路 问题 的 例子 


解 ” 容 易 看 出 ,从 5 到 工 的 路 线 共 12 条 ,用 枚 举 法 当然 可 以 找 出 最 短路 ,但 是 当 路 
段 很 多 时 计算 量 太 大 . 用 动态 规划 方法 解决 这 个 问题 的 思想 来 源 于 生活 中 的 一 个 基本 常 
识 : 如 果 已 经 找到 从 S 到 工 的 最 短路 是 上 :SA 一 B, 一 C1 一 T( 图 9.3 中 粗 线 ), 那么 ， 
从 上 上 任何 一 点 如 Bs 到 全 的 最 短路 -- 定 是 工 的 一 段子 路 线 工 , :B: 一 Ci 一 了 否则 , 若 B， 
到 工 的 最 短路 是 男 一 条 路 线 L;, 则 把 5S 一 A 一 Bs 与 1; 连 起 来 ,就 得 到 不 同 于 上 的 从 S 到 
TT 的 最 短路 . E 

由 此 ,为 了 得 到 从 S 到 本 的 最 短路 , 只 需 先 求 出 从 A;(i 二 1,2,3) 到 械 的 最 短路 ;为 
了 求 出 从 Ai(i= 二 1,2,3) 到 械 的 最 短路 , 只 需 先 求 出 从 B;(j 二 1,2) 到 械 的 最 短路 ; 接着 ， 


‘0 


只 需 先 求 出 从 CC=1,2) 到 工 的 最 短路 ,而 这 可 立即 得 到 ( 例 中 CC=1,2) 到 工 的 路 线 
是 惟一 的 ). | 

具体 做 法 是 : 把 从 S 到 工 的 行驶 过 程 分 成 二 1, 2, 3, 4 共 4 个 阶段 , 即 S>A;(i= 
1,2 或 3), A 一 B;(j 二 1 或 2), B;>Ci(! 二 1 或 2), CT. 记 d(X,Y) 为 城市 久 与 了 之 
间 的 直接 距离 ( 阁 这 两 个 城市 之 间 没 有 道路 直接 相连 , 则 可 以 认为 直接 距离 为 无 穷 大 ) ,用 
工 (X) 表 示 城 市 和 到 工 的 最 短路 的 长 度 ， 则 

k=4, L(C1)=5, L(C,)=6; 

k=3, L(B)=min{d(Bi ,Ci)+L(C,), a(Bi,C)+L(C,))} 

二 min(7 十 5, 7 十 6} 二 12， 

最 短路 是 Bi 一 CI 一人， 

L(B,)=min{d(B; ,Ci) 二 TL(C), dlB,,C;)L(C,)} 

二 min{8 十 5, 9 十 6) 二 13， 

最 短路 是 B, 一 C1 一 TT; 

k=2, L(A1)=min{d(Ai,Bi)+TL(B,), dl(A,B,)TL(B,)} 

二 min{6 十 12, 5 十 13} 二 18， 

最 短路 是 A1 一 Bl 一 C1 一 TT， 

L(As)—=min{a(A, ,Bi)+L(B), d(A,,B,)+L(B,)}=min{612, 6+13}=18, 
最 短路 是 A, 一 B. 一 Ci 一， 

L(A;)=min{a(A;,B,)+TL(B)), a(lA;,B,)+L(B,)}=min(7+12, 4+13)=17,， 
最 短路 是 4A: 一 B: 一 CI 一 了 ; 

R 一 1, 工 (CS) 王 mintd(S,A) 十 LGAD，d(CS,A) 十 LA )，dC9,A) 十 LA )) 

一 min{6 十 18，3 十 18，3 十 17} 王 20， 

最 短路 是 SA4: 一 B: 一 C 一 了 ,这 条 最 短路 的 长 度 为 20. 

显然 ,这 种 办 法 的 计算 量 比 枚 举 法 小 , 当 路 段 增 加 时 其 优势 更 为 显著 ,并 且 , 这 种 办 法 
得 到 的 不 仅 是 从 S 到 了 的 最 短路 ,而 且 得 到 了 从 任何 一 点 到 工 的 最 短路 . 

上 面 的 方法 称 为 动态 规划 (dynamic programming) ,是 数学 规划 的 一 个 分 支 ， 具有 广 
泛 的 应 用 领域 . 动态 规划 主要 用 于 处 理 多 阶段 决策 问题 ,所 谓 多 阶段 决策 (multi-stage 
decision making) ,是 将 决策 问题 的 全 过 程 恰当 地 划分 为 若干 个 相互 联系 的 子 过 程 (每 个 
子 过 程 为 一 个 阶段 ) ,以 便 按照 一 定 的 次 序 去 求解 . 在 多 阶段 决策 问题 中 ,每 个 阶段 开始 
时 所 处 的 自然 状况 或 客观 条 件 称 为 状态 ,一 般 用 状态 变量 如 zx 来 描述 ， 当 过 程 处 于 某 个 
阶段 的 某 个 状态 时 ,从 该 状态 演变 为 下 一 个 阶段 某 状态 所 作 的 选择 称 为 决策 ,一 般 用 决策 
变量 如 xx 描述 ， 由 所 有 各 阶段 的 决策 组 成 的 决策 序列 称 为 策略 ,其 中 能 使 总 体 性 能 ( 目 
标 函 数 ,对 子 过 程 通常 称 为 准则 函数 ) 达 到 最 优 的 策略 称 为 最 优 策略 . 

动态 规划 解决 问题 时 要 求 目 标 函 数 ( 准 则 函数 )V 具有 某 种 “可 分 性 ”, 即 
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Vi = ve xe) OD Vi - (31) 
这 里 的 运算 “QD” 可 以 是 通常 的 加 法 或 乘法 等 运算 , Vi., 表 示 阶 段 & 到 最 后 阶段 ”的 准则 
函数 ， 而 w(Czeyw) 是 第 & 阶段 的 准则 函数 . 

在 动态 规划 中 ,多 阶段 决策 要 求 具有 无 后 效 性 , 即 当 某 阶 段 的 状态 一 旦 确定 , 则 此 后 
过 程 的 演变 不 再 受 此 前 各 状态 和 决策 的 影响 , 或 者 说 “未 来 与 过 去 无 关 ”. 因此 ， 当 前 状 
态 是 此 前 历史 的 一 个 完整 总 结 , 而 此 前 历史 只 能 通过 当前 状态 去 影响 未 来 的 演变 ， 即 由 
zk 状态 出 发 的 后 部 子 过 程 可 以 看 成 一 个 以 x; 为 初始 状态 的 独立 过 程 ， 此 时 ,状态 转移 
方程 的 一 般 形 式 为 

Xn = T(x ue). (32) 

建立 动态 规划 模型 的 基本 过 程 是 :: 

(1) 正确 划分 阶段 ,选择 阶段 变量 &. 〈 阶 段 一 般 是 根据 时 间 和 空间 的 自然 特征 来 划 
分 ,便于 以 问题 的 求解 为 目的 . ) ， 

(2) 对 每 个 阶段 ,正确 选择 状态 变量 x EX (Xi 表示 上 阶段 的 状态 集合 ). 选择 状态 
变量 时 应 当 注 意 两 点 : 一 是 要 能 够 正确 描述 过 程 的 演变 特性 ,二 是 要 满足 无 后 效 性 . 

(3) 对 每 个 阶段 ,正确 选择 决策 变量 wEUx (Us 表示 & 阶段 的 允许 决策 集合 ). 

(4) 列 出 相 邻 阶段 的 状态 转移 方程 : z+1 二 T(x ,ur). 

(5) 列 出 按 阶段 可 分 的 准则 函数 Vi.，. 

假设 间 题 的 目标 是 极 小 化 ( 极 大 化 也 类 似 ) ,用 f(x) 表示 第 k 阶段 状态 为 xx 时 从 上 
到 最 后 阶段 n 这 一 后 部 子 过 程 的 最 优 准 则 函数 ( 即 准 则 函数 VV, 的 最 优 值 ) ,而 fi (zx,+1) 
一 般 可 以 根据 实际 意义 得 到 (如 f+1(xs+1) 王 0, 称 为 边界 条 件 ), 于 是 有 如 下 道 序 递 推 公 
式 (图 9.4 是 逆序 递 推 过 程 的 图 示 ): 


CCze) < min[v (zx » Us) 二 fu(zm)], EL 一 T(x yu), 
u, EU 
I (33) 
flrn) 一 0， k=nn—m1,.,1. 


方程 (33) 称 为 动态 规划 基本 方程 ， 当 按 式 (33) 计 算 至 fi (xi) 时 即 得 到 最 优 的 目标 函数 
值 ,再 顺序 地 查找 使 V,, 达 到 最 优 的 决策 ws(k 二 1，2,…, n) ,就 得 到 最 优 策略 . 
”类 似 地 ,有 些 问 题 也 可 以 建立 顺序 递 推 的 动态 规划 基本 方程 . 


| 
2 Xk Xl 


FE 
+ 


CG) fb0%) ln) Jo 
图 9.4 动态 规划 的 逆序 递 推 过 程 


下 面 是 一 个 用 动态 规划 方法 解 整数 规划 的 例子 . 
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例 4 资源 分 配 问题 

某 公司 准备 将 M 台 设 备 分 配给 所 属 的 N 家 工厂 . 已 知 当 分 配 wu 台 设 备 给 工厂 
时 ,工厂 & 利用 这 些 设备 为 公司 创造 的 利润 为 gw7)CG 委 AS 六 ). 一 般 来 说 ,所 有 gi (zw ) 之 0 
且 为 增 函 数 . 应 当 如 何 分 配 设备 资源 ,使 得 公司 总 利润 最 大 ? 

解 ” 该 问题 可 以 用 整数 规划 描述 如 下 : 


N 
max >z 一 > gi us), 
大 一 1 (34) 
N 
Ss.t. Du 一 AM， us 为 非 负 整数 . 
k=1 


由 于 gr (ui) 不 一 定 是 线性 函数 ,因此 式 (34) 可 能 是 非 线 性 整数 规划 . 我 们 把 它 转化 
为 多 阶段 决策 过 程 ,建立 动态 规划 模型 . 

共有 N 个 工厂 ,可 以 把 问题 分 解 为 N 个 阶段 : 在 任意 阶段 &( 二 N,N 一 1,…,1), 公 
司 把 手中 拥有 的 设备 分 配给 工厂 . 

状态 变量 zx 可 以 选 为 : x 表示 第 阶段 初 公司 手中 拥有 的 设备 台数 . 由 题 意 可 知 


Ms 


决策 变量 w 可 以 选 为 : us 表示 第 阶段 分 配给 工厂 I 因 
此 状态 转移 方程 为 zt+l 一 六 一 tu 

阶段 大 的 准则 函数 为 Ur (Te sa) = gr (us). 

用 fi (xz) 表示 将 手中 现 有 资源 x 依次 分 配给 工厂 &,k& 十 1,…,N 时 的 最 大 利润 ， 则 
有 如 下 动态 规划 基本 方程 


filzi) = max [glu) 十 fanlzra)], XH = Xi di, 
ee (35) 
fun xn) 一 0， k= N,N—1,.…,1. 


由 式 (35) 计 算 至 fi CUM) 时 就 得 到 原 问 题 的 结果 . 
设 M=4, N 二 3, gi(ui) 由 表 9.4 给 出 ,我 们 按照 式 (35) 计 算 . 


表 9.4 
工厂 大 

设备 数 En 1 2 3 

VV Ug | 
0 0 0 0 
] 4 2 3 

+ 

2 6 5 5 
3 7 6 7 
4 ‘ 8 8 


可 以 看 出 gr (ui) 是 增 函 数 . 显然 有 z 二 47 一 0,0 委 zi 和 4(R 一 2,3)， 递 推 求 解 如 下 : 
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边界 条 件 : A(z)= 广 (0) 一 0. 
R=3,fs(x3) = max [gsCu3)t f1(0)]= gs (zx), 


f3(0)=g3(0)=0; f3(1)=g3(1)=3; f3(2)=g3(2)=5; 
f3(3)=g;(3)=7; fi1(4)=g;(4)=8. 
k=2,f;(xs a Lga(u) tT f(x)]= max [gz (uz)t f(x — us)], 


f2(0)= max [ga(ua)t fs (0 u))=g2 (0) tf (0)=0+0=0; 
户 (D 一 max [gu)t fll—u)]=max{(gs(0)+ fs(1) ,Bg2(1) 二 fC(0)} 


二 max{0 十 3,2 十 0} 二 3; 
fi(2)= max [gs(xz) 十 六 (2 一 za) 


一 max{(gz(0) 十 /(2):,gz(1) 十 (gz(2) 十 大 (CO0)) 
二 max{0 十 5,2 十 3,5 十 0} 二 5; 
fi(3)= max [gz uz) fs(3—wuz)] 
0<u, 3 


一 max{gz(0) 十 户 (3) ,g2(1)+ fa3(2),g82 (2)+ fs(1) ,g2(3) 二 fC0)} 
二 max{0 十 7,2 十 5,5 十 3,6 十 0} 二 8; 
fa(4)= max Lg (ua)t fs (4 ua)] 


=max{gz (0) 二 f3(4),g2(1)+ fs(3),g2(2)+ fs (2), 
g2(3) 十 f3(1) ,gz (4) 二 fC(0)} 
二 max{0 十 8,2 十 7,5 十 5,6 十 3,8 十 0} = 二 10; 
EU a La 0) ar get) tr) 


f1(4)= max [g(t )t fi (4—wu)] 
Oul EA 


=max{g1(0) 二 fi(4),g1(1)+ fi(3),81(2)+ fi(2),g1(3)+ fi(1), 
g1(4) 十 f (0))} 
: 一 max{(0 十 10,4 十 8,6 十 5,7 十 3,7 十 0) 一 12. 
得 到 f1(4) 二 12 为 最 大 利润 . 进一步 分 析 计 算 过 程 , 可 以 知道 f1 (4) 二 12 在 ww 二 1， 
zz 二 2 ,ws 二 1 时 成 立 ， 因 此 最 优 解 为 ur 二 1,u? 二 2,u3 一 1 
实际 上 ,对 于 以 数据 形式 给 出 的 gi (wu) ,整数 规划 模型 (34) 只 能 用 上 述 动态 规划 方 
上 述 方法 可 以 推广 到 有 两 种 (或 更 多 ) 资 源 可 供 分 配 的 二 维 ( 或 多 维 ) 资 源 分 配 问题 . 
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9.3 用 LINDO 和 LINGO 解 整数 规划 


LINDOCLinear INteractive and Discrete Optimizer) 和 LINGO (Linear INteractive 
and General Optimizer) 是 由 美国 芝加哥 大 学 的 Linus Schrage 于 1986 年 开发 的 优化 计 
算 软 件 包 , LINDO 可 以 用 来 求解 线性 规划 、 线 性 整数 规划 、 二 次 规划 和 整数 二 次 规划 ,而 
LINGO 除 此 之 外 还 可 以 解 非 线性 规划 和 非 线 性 整数 规划 . 该 软件 的 最 大 特点 在 于 其 对 整 
数 规划 的 处 理 能 力 比 较 强 ,而 且 模 型 的 输入 比较 方便 ,使 用 起 来 比较 简单 . 从 LINDO 公 
司 的 主页 (http://www. lindo. com) 上 读者 可 以 了 解 更 多 的 有 关 信 息 , 并 可 以 下 载 软件 的 


试用 版 . . 


先 介 绍 用 LINDO 求解 线性 规划 的 方法 . 
9.3.1 用 LINDO 求解 线性 规划 


用 LINDO 求解 线性 规划 (LP) 时 ,首先 在 LINDO 软件 的 模型 窗口 输入 一 个 LP 模 
型 ,模型 以 MAX 或 MIN 开始 , 按 线性 规划 问题 的 自然 形式 输入 ( 见 下 面 例子 所 示 ). 输入 
结束 时 只 需 键入 END. 
我 们 来 解 前 面 例 1 中 的 整数 规划 模型 (25) 对 应 的 如 下 LP 松弛 问题 ， 
， max z= 5Xxi 十 8z，， 
i ae i se 
571 十 9x 之 45， 
0 
由 于 LINDO 中 已 假设 所 有 的 变量 都 是 非 负 的 , 所 以 非 负 约束 不 必 输 入 ;LINDO 也 
不 区 分 变量 中 的 大 小 写字 符 ( 实 际 上 任何 小 写字 符 将 被 转换 为 大 写字 符 ); 约 束 条 件 中 的 
“< 二 ”及 “ 汪 =”" 可 用 “<” 及 “之 ” 代 奉 . 在 LINDO 模型 窗口 输入 如 下 : 


(36) 


MAX 5X1 + 8X2 


ST ! 说 明 : ST 以 下 为 约束 条 件 
X1 二 XxX2<=6 
5X1 
十 9X2 二 = 45 ! 说 明 : 一 个 约 东 分 成 两 行 写 也 没有 关系 
END 


用 鼠标 单 击 菜单 中 的 求解 命令 (SOLVE) 就 可 得 到 解答 ,结果 窗口 显示 如 下 ， 


LP OPTIMUM FOUND AT STEP 2 
OBJECTIVE FUNCTION VALUE 
1) 41.25000 


人 
a 
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VARIABLE VALUE REDUCED COST 
xX] 2.250000 0.000000 
X2 3.750000 0.000000 
ROW SLACK OR SURPLUS DUAL PRICES 
2) 0.000000 1.250000 
3) 0.000000 0.750000 
NO. ITERATIONS= 2 


一 个 问题 解答 之 后 ，LINDO 会 询问 是 否 需要 做 敏感 性 分 析 (DO RANGE 
(SENSITIVITY) ANALYSIS? ) 如 果 你 不 需要 ,应 回答 “N”(NO). 

计算 结果 表明 : ， 

“LP OPTIMUM FOUND AT STEP2” 表 示 单 纯 形 法 在 两 次 送 代 (旋转 ) 后 得 到 最 

“OBJECTIVE FUNCTION VALUE 1) 41. 25000” 表 示 最 优 目 标 值 为 41. 25000 
(LINDO 中 将 目标 函数 自动 看 作 第 1 行 , 从 第 2 行 开 始 才 是 真正 的 约束 行 ). 

“VALUE” 给 出 最 优 解 中 各 变量 (VARIABLE) 的 值 : X1=2.250000，X2=3.750000. 

“REDUCED COST” 的 合 义 是 ( 对 max 型 问题 ) : 基 变 量 的 reduced cost 值 为 0; 对 于 
非 基 变量 ,相应 的 reduced cost 值 表示 当 该 非 基 变量 增加 一 个 单位 时 (其 他 非 基 变量 保 
持 不 变 ) 目 标 函 数 减少 的 量 . 本 例 中 两 个 变量 都 是 基 变 量 , 此 值 均 为 0. 实际 上 ,熟悉 线性 
规划 的 单纯 形 算法 的 读者 可 以 发 现 ,“REDUCED COST” 给 出 的 是 最 优 单纯 形 表 中 决策 变 
量 对 应 的 “判别 数 ”( 也 称 为 “检验 数 ”).“REDUCED COST” 还 有 另 一 种 等 价 的 解释 : 为 了 
使 非 基 变量 变 成 基 变 量 ,该 变量 在 目标 函数 中 对 应 的 系数 应 该 增加 的 量 . 

“SLACK OR SURPLUS"? 给 出 松弛 (或 剩余 ) 变 量 的 值 :表示 约束 是 否 起 作用 约束 : 第 
2 第 3 行 松 弛 变量 均 为 0, 说 明 对 于 最 优 解 而 言 ,两 个 约束 (第 2、 第 3 行 ) 均 是 起 作用 约 


` 束 ( 取 等 号 ). 


“DUAL PRICES” 给 出 约束 的 影子 价格 (也 称 为 对 偶 价格 ) 的 值 : 第 2、 第 3 行 (约束 ) 对 
应 的 影子 价格 分 别 为 1. 250000,0.750000. 

“NO. ITERATIONS 二 2? 表 示 用 单纯 形 法 进行 了 两 次 迭代 (旋转 )， 

如 果 对 上 面 的 “是 否 需要 做 敏感 性 分 析 ” 的 询问 回答 “Y”(YES) , 则 LINDO 还 会 输出 
以 下 结果 : 

RANGES IN WHICH THE BASIS IS UNCHANGED : 

OBJ COEFFICIENT RANGES 
VARIABLE CURRENT ALLOWABLE ALLOWABLE 


。 COEF INCREASE DECREASE 
X1 5.000000 3.000000 0.555556 
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X2 8.000000 1.000000 3.000000 


RIGHTHAND SIDE RANGES 


ROW CURRENT ALLOWABLE ALLOWABLE 
RHS INCREASE DECREASE 

2 6.000000 3.000000 1.000000 

3 45.000000 9.000000 15.000000 


以 上 显示 的 是 当前 最 优 基 (和 矩阵) 保持 不 变 的 充分 条 件 (RANGES IN WHICH THE 
BASIS IS UNCHANGED), 包括 目标 函数 中 决策 变量 对 应 的 系数 的 变化 范围 (COBj 
COEFFICIENT RANGES) 和 约束 的 右 端 项 的 变化 范围 (RIGHTHAND SIDE 
RANGES) 两 部 分 . 

例如 : 前 一 部 分 的 输出 行 


X1 5.000000 3.000000 0.555556 


表示 决策 变量 X1 当前 在 目标 函数 中 对 应 的 系数 为 5 ,允许 增加 3 和 减少 0. 555556. 也 就 
是 说 , 当 该 系数 在 区 间 [4. 444444,8] 上 变化 时 (假设 其 他 条 件 均 不 变 ) ,当前 最 优 基 和 矩阵 保 
持 不 变 . 对 X2 对 应 的 输出 行 也 可 以 类 似 地 解释 . 由 于 此 时 约 东 没有 任何 改变 ,所 以 最 优 
基 和 矩阵 保持 不 变 意 味 着 最 优 解 不 变 ( 当 然 ,由 于 目标 函数 中 的 系数 发 生变 化 ,最 优 值 还 是 
会 变化 的 ). 

后 一 部 分 的 输出 行 

2 6.000000 3. 000000 1.000000 


表示 约束 2 当前 右 端 项 为 6, 允 许 增加 3 和 减少 1. 也 就 是 说 , 当 该 系数 在 区 间 [5,9] 上 变 
化 时 (假设 其 他 条 件 均 不 变 ), 当前 最 优 基 答 阵 保持 不 变 . 对 约束 3 对 应 的 输出 行 也 可 以 类 
似 地 解释 .由 于 此 时 约束 已 经 改变 ,虽然 最 优 基 矩阵 保持 不 变 , 最 优 解 和 最 优 值 还 是 会 变 
化 的 . 但 是 ,由 于 最 优 基 和 矩阵 保持 不 变 , 所 以 前 面 的 “DUAL PRICES” 给 出 的 约束 的 影子 
价格 此 时 仍然 是 有 效 的 . 

用 LINDO 求解 LP 问题 时 ,应 注意 以 下 几 个 问题 ， 

(1) 模型 以 MAX 或 MIN 开始 定义 目标 函数 (注意 不 需要 等 号 ); 目标 函数 及 约束 条 件 
之 间 一 定 要 有 ST 或 S.T. 或 SUBJECT TO 或 SUCH THAT 分 开 ;END 语句 表示 约束 条 件 
输入 结束 . 

(2) 约束 中 > (或 < ) 号 与 > = (或 < = ) 功 能 相同 . 

(3) 变量 名 不 能 超过 8 个 字符 ,并 且 以 字母 开头 ;变量 名 (包括 LINDO 中 的 关键 字 也 
不 区 分 大 小 写 ). 

(4) 变量 与 其 系数 间 可 以 有 空格 (甚至 回 车 ) ,但 不 能 有 任何 运算 符号 (如 乘 号 x 等 ). 
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(5) LINDO 不 允许 变量 出 现在 一 个 约束 条 件 的 右 端 . 

(6) LINDO 中 不 能 接受 括号 ”( )” 和 逗号 “,”, 例如 :400(X1+X2) 需 写 为 400X1 十 
400X2 , 等 . 

(7) 表达 式 应 当 已 经 经 过 化 简 , 如 不 能 出 现 2X1 十 3X2 一 4X1, 而 应 写成 一 2X]1 十 
3X2 等 ， 

(8) LINDO 中 已 假定 所 有 变量 非 负 . 可 在 END 语句 后 用 FREE vname 命令 将 变量 
vname 的 非 负 假定 取消 ;还 可 以 用 SUB, SLB 命令 设 定 变 量 的 上 界 、 下 界 . 

《9) LINDO 将 目标 函数 所 在 行 作为 第 一 行 ,从 第 二 行 起 为 约束 条 件 . 行 号 自动 产生 ， 
也 可 以 人 为 定义 行 号 或 行 名 , 行 号 或 行 名 放 在 该 行 前 面 ,以 “)” 结 束 . 行 名 和 变量 名 一 样 ， 
不 能 超过 8 个 字符 . 

(10) LINDO 文件 中 常 有 注释 间 杂 于 各 命令 之 中 ,前 面 注 有 [!j 符 号 . 例如 : 1 This 
is a comment. 


(11) 在 模型 的 任何 地 方 都 可 以 用 TITLE 对 模型 命名 或 标识 (最 多 72 个 字符 ), 如 ， 


TITLE This Model is only an Exampie 


9.3.2 用 LINDO 求解 整数 规划 


LINDO 可 用 于 求解 单纯 的 或 混合 型 的 整数 规划 . LINDO 求解 IP 问题 用 的 是 分 枝 定 
界 法 . 但 目前 IP 尚 无 完善 的 敏感 性 分 析 理 论 , 因 此 敏感 性 分 析 存 整数 规划 中 没有 意义 . 
IP 间 题 的 输入 与 LP 类 似 , 但 在 END 语句 标志 后 需 定 义 整 型 变量 , 用 GIN 来 标识 ， 


GIN vname . 
或 
GINn 


前 者 只 将 变量 vname 标识 为 整 型 , 后 者 将 模型 中 前 ”个 变量 标识 为 整 型 (变量 顺序 由 输 
入 决定 , 该 顺序 可 在 输出 结果 中 查证 ). 
0-1 型 的 变量 由 INTEGER( 可 简写 为 INT) 来 标识 : 


INT vname 


J 


INT n 


前 者 只 将 变量 vname 标识 为 0-1 型 , 后 者 将 模型 中 前 x 个 变量 标识 为 0-1 型 . 
例 1 的 整数 规划 模型 (25) 应 输入 : 
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MAX 5X1 十 8X2 
ST 

X1 十 X2<6 
5X1 十 9X2< 45 
END 

GIN 2 


运行 后 在 结果 窗口 的 前 半 部 显示 了 一 些 有 关 分 枝 定 界 的 计算 信息 ,后 半 部 才 是 我 们 有 用 
的 结果 : 
LAST INTEGER SOLUTION IS THE BEST FOUND 


RE-INSTALLING BEST SOLUTION... 
OBJECTIVE FUNCTION VALUE 


1) 40.00000 
VARIABLE VALUE REDUCED COST 
X1 0.000000 一 5.000000 
X2 5.000000 一 8.000000 
ROW SLACK OR SURPLUS DUAL PRICES 
2) | 1.000000 0.000000 
3) 0.000000 0.000000 

NO. ITERATIONS= 12 

BRANCHES=3 DETERM.= 1.000E 0 


即 最 优 解 为 X1=0，X2 王 5. 最 优 值 为 40. 
9.3.3 用 LINGO 求解 整数 规划 


LINGO 软件 可 用 于 求解 线性 或 非 线性 规划 (无 论 是 连续 规划 还 是 整数 规划 ), 因此 
包含 了 LINDO 的 功能 .在 LINGO 中 ,输入 总 是 以 model: 开 始 , 以 end 结束 ;中 间 的 语句 
之 间 必 须 以 “;” 分 开 ; 目标 函数 用 MAX=...; 或 MIN=...; 给 出 (注意 有 等 号 “=”). 在 
LINGO 中 所 有 的 函数 均 以 “@ ”符号 开始 ,如 约束 中 @gin(X1) 表 示 X1 为 整数 ,用 @ 
bin(X1) 表 示 X1 为 0-1 整数 (注意 没有 @int 函数 ). 在 现在 的 LINGO 中 ,默认 设置 假定 所 
有 变量 非 负 . 

例如 , 例 1 中 的 整数 规划 模型 (25) 在 LINGO 中 可 以 如 下 输入 : 


model: 
X1 + X2 < 6; ! 约束 条 件 和 目标 函数 可 以 写 在 model: 与 end 之 间 的 任何 位 置 
MAX=5x X1 + 8 x X2; ! x 号 不 能 省 略 


5xX1< = 45 一 9x X2; 
@gin(X1);@gin(X2); ! 和 LINDO 不 同 , 不 能 写 在 end 之 后 


9.3 用 LINDGO 和 LINGO 解 整数 规划 


end 


运行 后 同样 得 到 最 优 解 为 X1=0，X2 王 5， 最 优 值 为 40. 

值得 说 明 的 是 ,即使 是 线性 模型 ,在 LINDO 中 书写 格式 非常 严格 ,约束 也 只 能 一 个 
一 个 输入 ,因此 输入 一 个 大 规模 的 模型 是 比较 困难 的 . 而 LINGO 不 仅 能 解 非 线 性 模型 ， 
书写 格式 相当 自由 ,而 且 有 一 个 非常 大 的 优点 , 即 LINGO 实际 上 提供 了 数学 规划 模型 的 
一 种 建 模 描述 语言 ,输入 一 个 大 规模 的 模型 也 是 很 方便 的 . 例如 ,一 个 LINGO 程序 除了 
主体 部 分 (目标 和 约束 ) 外 ,还 可 以 有 以 SETS:; 开 始 .ENDSETS 结束 的 集合 部 分 (用 于 定 
义 集 合 变量 及 其 属性 ) ,以 DATA: 开 始 `.ENDDATA 结束 的 数据 部 分 (用 于 输入 已 知 参 
数 ), 以 及 以 INIT: 开 始 `ENDINIT 结束 的 初 值 部 分 (用 于 给 出 变量 初 值 ). 

作为 一 个 例子 ,我 们 用 LINGO 来 解 前 面 的 例 3( 最 短路 问题 ). 用 1,2,…，9 表示 城 
市 TT, Ci, Ci， B;, B;, Al， A;， A;， S, 则 可 以 编写 如 下 LINGO 程序 ; 


model : 

SETS : 1 CITIES 表示 由 1~9 组 成 的 集合 ,是 一 个 基本 集合 
CITIES /1...9/ :Li ! 属性 L(GD 表 示 城 市 1 到 城市 1 的 最 优 行驶 路 线 的 路 长 
ROADS(CITIES, CITIES)/ 1 ROADS 表示 网 络 中 的 弧 , 是 由 CITIES 派生 的 集合 
9,6 9,7 9,8 ! 由 于 并 非 所 有 城市 间 都 有 道路 直接 连接 ,所 以 将 弧 具 体 列 出 
6,46,57,47,5 8,48,5 
4,2 4,3 5,2 5,3 
2,13,1/ : Di ! 属性 D(i,j) 是 城市 i 到 j 的 直接 距离 (已 知 ) 

ENDSETS 

DATA: 

D= ! D 赋值 的 顺序 对 应 于 ROADS 中 的 弧 的 顺序 
633 
658674 
6789 
56; 

ENDDATA 

L(1) = 0; ! 边界 条 件 ; ; 

@FOR(CITIES() li #GT# 1: ! 集合 循环 语句 ; 闪 GT 划 表示 逻辑 关系 “大 于 ” 

LOGD=@MNCROADSG,j) : DCOi,)) +L())) ! 这 就 是 动态 规划 基本 方程 

) 

end 


从 以 上 模型 中 可 以 看 出 : 一 个 LINGO 程序 甚至 可 以 没有 目标 函数 . 该 程序 也 没有 初 
值 部 分 ,但 有 集合 部 分 和 数据 部 分 . LINGO 中 的 集合 相当 于 下 标 集合 的 意思 ,集合 部 分 定 
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义 的 CITIES 是 一 个 基本 集合 (元 素 通过 枚 举 给 出 ),L 是 其 对 应 的 属性 变量 ;ROADS 是 由 
CITIES 派生 的 一 个 派生 集合 (由 于 并 非 所 有 城市 间 都 有 道路 直接 连接 , 所 以 将 弧 具 体 列 
出 ,这样 的 派生 集合 称 为 稀 朴 集合 )，D 是 其 对 应 的 属性 变量 . @FOR 函数 用 于 定义 一 个 


循环 语句 . 
运行 以 上 程序 后 得 到 : 
LCT) 0.000000 
L(2) 5.000000 
L(3) 6.000000 
L(4) 11.00000 
L(5) 13.00000 
L(6) 17.00000 
L(7) 19.00000 
L(8) 17.00000 
L(9) 20.00000 


所 以 , 从 S 到 人 的 最 优 行驶 路 线 的 路 长 为 20( 进 一 步 分 析 以 上 求解 过 程 , 可 以 得 到 
从 5 到 工 的 最 优 行驶 路 线 为 S> A 一 B 一 CI 一 了)， 

LINGO 中 还 包括 相当 丰富 的 数学 函数 和 控制 语句 ,并 可 以 直接 利用 其 他 应 用 系统 
《如 Microsoft EXCEL 或 ACCESS) 提 供 的 数据 文件 或 数据 库 . 此 外 ,LINDO 公司 还 开发 
了 一 个 称 为 LINDO-API 的 产品 ,提供 与 其 他 语言 (如 VB, C++ ，MATLAB 等 ) 的 接口 . 
LINDO-API 与 MATLAB 连接 后 ,就 如 同 在 MATLAB 中 安装 了 一 个 新 的 LINDO( 包 括 
LINGO) 工 具 箱 一 样 . 总 之 ,LINGO 软件 的 功能 比较 强大 ,使 用 也 比较 方便 . 


9.4 实例 的 求解 


9.4.1 选课 问题 ( 续 ) 


9.1.1 节 提出 的 “选课 方案 ”模型 (3) 可 以 如 下 输入 LINDO 软件 : 


MIN X1+ X2 十 X3 十 X4 十 X5 十 X6 十 XZ 二 X8 十 X9 十 XI0 
十 X11 十 X12 十 X13 十 X14 十 X15 十 X16 + X17 + X18 
SUBJECT TO 
5X1 十 5X2 十 4X3 十 4X4 十 3X5 十 3X6 十 3X7 十 2X8 一 yl =10 
3X9 十 3X10 十 3X11 十 2X12 十 2X13 十 2X14 十 X15 十 X16 十 X17 十 X18 一 y2 = 0 
yl + y2 ~y=-—2 
y 之 = 20 
6y2 ~- y>>=0 
3y2 ~— y==0 


9.4 实例 的 求解 


X1 一 X5 之 = 0 
X2 一 X7 二 = 二 0 
X8 一 X9 之 = 0 


X6 一 X10 之 = 0 
X4 一 X11 之 = 0 
Xx5 一 X12 二 = 0 
X7 一 X13 二 = 0 
X6 一 XI14 之 = 0 
END 

INT 18 


得 到 最 优 解 为 : zs 一 x4 一 zo 一 x 一 zu 一 1, 其 他 zi 为 0, 和 = 12, ys 一 6, 一 20, 最 少 
要 选修 5 门 课 , 课 号 为 2,4,6,10,11. 

不 过 ,这 个 问题 的 最 优 解 不 惟一 . 例如 ,还 有 最 优 解 : zx 二 zs 一 x6 二 X10 二 x 二 1, 其 
他 zi 为 0,y1 王 13, yz 二 5,y 二 20. 一 般 来 说 ,得 到 一 个 整数 规划 问题 的 所 有 最 优 解 是 很 
困难 的 (而 且 判 断 一 个 整数 规划 问题 的 最 优 解 的 个 数 也 是 困难 的 ). | 

对 于 在 选修 最 少 学 分 ( 即 20 学 分 ) 的 情况 下 ,最 多 可 以 选修 多 少 门 课 的 问题 ,只 需要 
在 上 面 的 模型 中 增加 约束 > 一 20,， 并 将 模型 中 的 MIN 改 成 MAX. 求解 得 到 如 下 结果 ， 
Xl 一 XI 二 Xj 二 Xs 二 Xis 二 X16 二 X11y 二 X18 三 1, 其 他 x 为 0,;yi1 二 14,， ys 二 4,y 二 20, 即 
最 多 可 以 选修 8 门 课 . 请 读者 试 试 是 否 还 可 以 找到 其 他 的 最 优 解 . 


9.4.2 钢管 下 料 ( 续 ) 
问题 (1) 的 求解 ”将 式 (4) , 式 (6) 一 (9) 构 成 的 线性 整数 规划 模型 输入 LINDO 如 下 : 


MIN3x1 十 x2 + 3x3 + 3x4 + x5 十 x6 + 3x7 


Ss.t. 
4x1 +3x2 + 2x3 十 x4 + x5 盖 一 50 
x2 十 2x4 二 x5 十 3x6 二 = 20 
X3 十 x5 十 2x7 盖 = 15 
END 
gin 7 


求解 可 以 得 到 最 优 解 如 下 ; 


OBJECTIVE FUNCTION VALUE 

1) 27.00000 

VARIABLE VALUE REDUCED COST 
X1 0.000000 - 3.000000 
x2 12.000000 1.000000 
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x3 0.000000 3.000000 
x4 0.000000 3.000000 
x5 15.000000 1.000000 
x6 0.000000 1.000000 
x7 0.000000 3.000000 


即 按照 模式 2 切割 12 根 原 料 钢管 ,按照 模式 5 切割 15 根 原料 钢管 , 共 27 根 ,总 余 料 量 为 
27m. 显然 ,在 总 余 料 量 最 小 的 目标 下 ,最 优 解 将 是 使 用 余 料 尽 可 能 小 的 切割 模式 (模式 2 
和 模式 5 的 余 料 为 1m) ,这 会 导致 切割 原料 钢管 的 总 根 数 较 多 ， 

将 式 (5) 一 (9) 构 成 的 线性 整数 规划 模型 输入 LINDO 求解 ,可 以 得 到 最 优 解 如 下 : 


OBJECTIVE FUNCTION VALUE 


1) 25.00000 

VARIABLE VALUE REDUCED COST 

”x1 0.000000 1.000000 
x2 15.000000 1.000000 
x3 0.000000 1.000000 
x4 0.000000 1.000000 
x5 5.000000 1.000000 
x6 0.000000 1.000000 
x7 5.000000 1.000000 


即 按照 模式 2 切割 15 根 原料 钢管 , 按 模 式 5 切割 5 根 , 按 模式 7 切割 5 根 , 共 25 根 ,可 算 
出 总 余 料 量 为 35m. 与 上 面 得 到 的 结果 相 比 ,总 余 料 量 增加 了 8m, 但 是 所 用 的 原料 钢管 的 
总 根 数 减少 了 2 根 . 在 余 料 没有 什么 用 途 的 情况 下 ,通常 选择 总 根 数 最 少 为 目标 . 
问题 (2) 的 求解 ” 非 线性 整数 规划 模型 (10) 一 (18) 虽 然 用 LINGO 软件 可 以 直接 求 
解 ,但 为 了 减少 运行 时 间 , 可 以 增加 一 些 显然 的 约束 条 件 ,从 而 缩小 可 行 解 的 搜索 范围 . 
例如 ,由 于 3 种 切割 模式 的 排列 顺序 是 无 关 紧 要 的 ,所 以 不 妨 增加 以 下 约束 : 
Zi 之 7a 之 2a， (37) 
又 例如 ,注意 到 所 需 原料 钢管 的 总 根 数 有 着 明显 的 上 界 和 下 界 . 首先 ,无 论 如 何 , 原 料 


-4X50+5; - 
钢管 的 总 根 数 不 可 能 少 于 | 195X208X15] 一 26( 根 ). 其 次 ,考虑 一 种 非常 


特殊 的 生产 计划 : 第 一 种 切割 模式 下 只 生产 4m 钢管 ,一 根 原 料 钢 管 切割 成 4 根 4m 钢 
管 ,为 满足 50 根 4m 钢管 的 需求 ,需要 13 根 原料 钢管 ;第 二 种 切割 模式 下 只 生产 5m、6m 
钢管 ,一 根 原料 钢管 切割 成 1 根 5m 钢管 和 2 根 6m 钢管 ,为 满足 10 根 5m 和 20 根 6m 钢 
管 的 需求 ,需要 10 根 原料 钢管 ;第 三 种 切割 模式 下 只 生产 8m 钢管 ,一 根 原料 钢管 切割 成 
2 根 8m 钢管 ,为 满足 15 根 8m 钢管 的 需求 ,需要 8 根 原 料 钢 管 . 于 是 满足 要 求 的 这 种 生 
产 计 划 共 需 13 十 10 十 8 二 31 根 原料 钢管 ,这 就 得 到 了 最 优 解 的 一 个 上 界 . 所 以 可 增加 以 下 


约束 : 


model: 
min= x1++ x2 + x3; 


x1 x rill+x2xr1i2+x3*r13 > 三 50; 
Xl x*r21+ x2 x*r22+ x3*1r23 >=10; 
Xx1xr31 十 x2x*r32 十 Xx3x* r33 之 ==20; 
X1xr41 十 Xx2 x* r42 十 X3x r43 盖 =15; 
4xrll+5x*r21+6xr31+8xr41 <==19; 
4xr1l2+5xr22+6*r32+8*r42 <=<=19; 
4xr1l3+5xr23+6xr33+8*xr43 =<=19; 
4xrll+5x*r21+6xr31+8xr41 >>=16; 
4xrl2 二 5xr22+6x*r32+8xr42 盖 =16; 
4xrl3+5xr23+6xr33+8x rd43 >=16; 


Xx1 十 x2 十 x3 二 = 26; 
Xx1 十 Xx2 二 x3 <= 31; 
x1==x2; 


x2> = x3; 


@gin(x1); @gin(x2); @gin(x3); 

@gin(rl1,; @gin(r12); @gin(r13); 
@gin(r21); @ gin(r22) ; @ gin(r23); 
@gin(r31); @gin(r32) ; @ gin(r33), 
@ gin(r41); @gin(r42) ; @gin(r43); 


end 


得 到 输出 如 下 : 


Local optimal solution found at iteration : 


Objective value: 
Variable 

X1 

X2 

x3 

r11 

r12 

r13 

r21 | 

r22 


26 Xl 十 Xz 十 3 和 31. 
将 式 (10) 一 (18)、(37) 式 (38) 式 构成 的 模型 输入 LINGO 如 下 : 


Value 
10.00000 
10.00000 
8.000000 
3.000000 
2.000000 
0.000000 
0.000000 
1.000000 


15187 


28.00000 
Reduced Cost 

0. 
.000000 
.000000 
.000000 
.000000 
.000000 
.000000 
.000000 


Ce ek 


000000 


9.4 


实例 的 求解 


(38) 


223 


实验 9 整数 规划 


r23 0.000000 0.000000 
r31 1.000000 0.000000 
r32 1.000000 0.000000 
r33 0.000000 0.000000 
r41 0.000000 0.000000 
r42 0.000000 0.000000 
r43 2.000000 0.000000 


即 按照 模式 1,2,3 分 别 切 割 10 根 ,10 根 ,8 根 原 料 钢管 ,使 用 原料 钢管 总 根 数 为 28 根 .第 
一 种 切割 模式 下 一 根 原料 钢管 切割 成 3 根 4m 钢管 和 1 根 6m 钢管 ;第 二 种 切割 模式 下 一 
根 原 料 钢管 切割 成 2 根 4m 钢管 .1 根 5m 钢管 和 1 根 6m 钢管 ;第 三 种 切割 模式 下 一 根 原 
料 钢管 切割 成 2 根 8m 钢管 . 

请 读者 试 试 , 如 果 不 增 加 约束 (37) 和 (38) ,程序 运行 时 间 有 多 大 差异 . 

最 后 ,作为 一 个 例子 ,说 明 利 用 定义 集合 的 方法 ,上 面 的 模型 也 可 以 如 下 输入 : 


model : 
SETS : 
NEEDS/1. .4/ : LENGTH ,NUM; ! 定义 基本 集合 NEEDS 及 其 属性 LENGTH ,NUM; 
CUTS/1..3/ : Xi ! 定义 基本 集合 CUTS 及 其 属性 X; 
PATTERNS(NEEDS, CUTS) : Ri 1 定义 派生 集合 PATTERNS( 这 是 一 个 稠密 集合 ) 及 其 属 
| 性 Ri 
ENDSETS 
DATA: 
LENGTH=456 8; 
NUM=50 10 20 15; 
CAPACITY = 19; 
ENDDATA 
min= @SUM(CCUTS() : XO() ); ! 目标 函数 ; 
@FOR(CNEEDS(D : @SUM(GCUTSCJ) : XCJ) x RJ) ) >>NUMCD ); ! 满足 需求 约束 ; 
@FOR(CUTS(J) : @SUM(CNEEDS(D) : LENGTHCD) * R(1,J) ) <CAPACITY )， ! 合理 切割 模 
式 约束 ; 
@FOR(CUTS(J) : @SUM(NEEDS(I) : LENGTHCD x RGJ) ) > CAPACITY 
— @MIN(NEEDS(!) : LENGTHCD ) ); ! 合理 切割 模式 约束 ; 
@SUM(CCUTS(1) : XCD ) >26; @SUM(CCUTS(1) : XCD ) 二 31; ! 人 为 增加 约束 ; 


@FOR(CCUTS(D 1I 间 LT 并 @SIZECCUTS) :XCD 二 XCI+1) ); ! 人 为 增加 约束 ; 
@FOR(CUTS(J) : @GINCX(J)) ) ; : 
@FOR(CPATTERNS(I,J) : @GIN(R(U, J)) ); 


end 


请 读者 仔细 阅读 上 面 的 程序 ,体会 LINGO 建 模 语言 的 强大 功能 . 显然 ,对 于 下 料 问 


9.4 实例 的 求解 


题 , 上 面 的 程序 将 具体 数据 完全 独立 出 来 ,具有 较 强 的 通用 性 . 
9.4.3 生产 批量 计划 ( 续 ) 


对 9.1.2 小 节 中 的 生产 批量 计划 问题 ,我 们 已 经 建立 了 其 线性 整数 规划 模型 (19) , 模 
型 (20) ,模型 (22) 一 (24), 自然 可 以 用 LINDO 或 LINGO 直接 求解 . 例如 编写 如 下 
LINGO 程序 : 


Model: 
SETS: 
PERIODS/1..4/ : S,C,H,D,X,I,Y; 
ENDSETS 
DATA: 

S=3333; 

C=50 50 50 50; 

H=1111; 

D=2324; 
ENDDATA 
M= @SUM(PERIODS(J) : D(J)); 
MIN= @SUM(CPERIODS(YJ) : SCJ) x Y(J) 十 CCJ) x XO) + HO x 1(J)); 
XC(1)— DO)=1(1); 
@FORCPERIODS(J) |J#GT#T :1 1)+X() 一 DCJ) =1CJ) ); 
@FORC(PERIODSC)) ; XCJ)<MxY(Cd)); 
@FOR(PERIODS(J) : @BINCY(J) )) 
END “8 


求解 可 得 问题 的 最 优 解 为 x! 二 2( 千 件 ), zs 二 5( 千 件 ), x 二 0《( 千 件 ), x 二 4( 千 件 )， 
问题 的 最 优 值 为 561( 千 元 ). 
由 于 该 问题 的 最 优 解 具 有 非常 特殊 的 结构 ， DI Ie a 


首先 ,容易 看 到 : 在 最 优 解 中 1 二 Tr 二 0, 嗓 >= 2 步 可 以 证 明 : 一 定 


存在 满足 条 件 [一 一 0(1 坟 上 魏 T) 的 最 优 解 . 由 于 以 上 两 不 性 质 ,只 4 有 当 上 一 时 段 库 存 
1-1 二 0 时 ,本 时 段 才 考 虑 进行 生产 ; 且 一 旦 生产 ,其 生产 量 一 定 为 某 些 后 续 时 段 的 需求 量 
的 总 和 , 即 xz,€ {qd 十 dt ,di 十 diti1 十 … 十 dr}. 这 样 ,动态 规划 方程 可 以 简化 ， 如 
用 f. 表示 当 t 时 段 初始 库存 为 0 时 ,从 上 时 段 到 工时 段 的 子 问题 的 最 优 费 用 值 , 则 可 以 
建立 如 下 的 递 锥 关系 : 


每 次 生产 准备 费用 
单 件 生产 费用 
单 件 生产 库存 费用 
产品 需求 数量 


Jr 一 0， 

六 = en ee. 

上 人 入 
,mip [+ 3 Sp, + 广 |， 


j= 
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通过 逆序 递 推 计算 ,可 以 得 到 最 优 值 (费用 ) 为 z* = 了 . 
对 于 9. 1. 2 小 节 中 的 具体 问题 ,以 千 件 . 千 元 为 单位 ,相当 于 给 定 参 数 的 数值 如 下 : 
TT 二 4,c, 二 50( 千 元 ) ,5 一 3( 于 元 )， hh 二 1( 千 元 / 千 件 ) ,dj 一 2( 千 件 ), di 二 3( 千 件 ), 44; 二 
2( 千 件 ) ,d= 二 4( 千 件 ) ,具体 计算 过 程 如 下 : 
fs= 0; 
户 = 3 十 50X4 十 0 十 0 一 203; 
所 二 min{3 十 50X(2 十 4) 十 1X4 十 0,3 十 50X2 十 0 十 203) 二 306; 
户 = min{3 十 50X (3 十 2 十 4) 十 1X (2 十 4) 十 1X4 十 0,3 十 50X (3 十 2) 十 1X2 十 203， 
3 十 50X3 十 0 十 306) 二 458; 
及 二 min{3 十 50X (2 十 3 十 2 十 4) 十 1X (3 十 2 十 4) 十 1X (2 十 4) 十 1X4 十 0， 
3 十 50XX (2 十 3 十 2) 十 1X (3 十 2) 十 1X2 十 203， 
3 十 50X (2 十 3) 十 1X3 十 306， 
3 十 50X2 十 0 十 458) 一 561. 
可 得 问题 的 最 优 解 为 xz! 二 2( 千 件 ),x; 二 5《 千 件 ) ,zx; 二 0( 千 件 ),xi = 二 4( 千 件 ) ,最 优 
值 为 561( 千 元 ). 
由 于 该 问题 的 特殊 性 ,也 可 以 方便 地 建立 顺序 递 推 的 动态 规划 方程 进行 求解 , 即 用 
ff 表示 当 0 时 段 初始 库存 为 0 时 ,从 0 时 段 到 上 时 段 的 子 问题 的 最 优 费用 值 ,建立 动态 规 
划 方 程 , 请 读者 试 着 完成 . 


需要 说 明 的 是 : 由 于 在 最 优 解 中 2 三 21d 一 11〈 于 件 ) ,因此 生产 总 量 是 一 个 常 


数 ;而 本 题 中 c: 一 50( 千 元) 也 是 一 个 常数 ,所 以 用 于 生产 的 这 部 分 费用 是 一 个 常数 
(550 于 元 ). 因此 ,可 以 在 前 面 的 计算 中 先 不 考虑 这 部 分 费用 , 即 把 c, 看 成 是 0 简化 进行 
计算 ,最 优 解 不 会 变化 ,新 的 最 优 值 加 上 550 于 元 即 为 原 问 题 的 最 优 值 ， 

能 否 用 解 最 短路 问题 的 类 似 方法 ,对 这 个 问题 编写 LINGO 程序 来 求解 呢 ? 请 读者 
思考 ， 


9.5 实验 练习 


实验 目的 
1. 练习 建立 实际 问题 的 整数 规划 模型 . 
2. 掌握 用 LINDO 和 LINGO 软件 求解 整数 规划 问题 . 


1. 用 分 枝 定 界 算法 求解 ,并 用 LINDO 或 LINGO 验证 得 到 的 结果 是 否 正确 : 
(1) min z = 77 十 9zz， 
s.t. 一 Xz 十 37x; 之 6， 
7 二 元 35， 
Ziyza €E ZT1. 
(2) max z = 40zx 十 907z，， 
s.t，9zi 十 7zxs 委 56， 
7zi 十 20zs 委 70， 
xiyzz E Zt, 
2. 用 动态 规划 方法 求解 ,并 用 LINDO 或 LINGO 验证 得 到 的 结果 是 否 正确 : 
(1) minz 二 XI 十 Xi 十 Xi 十 XxX? 一 ZX 一 27Xs 一 3Xxs 一 474， 


s.t. zl 十 xz 十 zs 十 zx 之 10， 
Ee J 
(2) max z = 5xi + 10zs + 3zs 十 6z， 
s.t，xzi 十 4zs 十 5zs 十 107z, 委 10， 
+ 


2 
TlsT2 TIT EL 


3. 用 LINGO 软件 求解 : 
max z 一 CIx 十 FQ 


s.t. 1 之 TTXzs 十 ZT4 < 魏 ]， 
一 3 委 工 十 zs 十 Ta 十 Ti < 魏 .2， 
XE {= 31) 
其 中 c=(6,8,4, 一 2)7，@ 是 三 对 角 矩 阵 , 主 对 角 线 上 元 素 全 为 一 1, 两 条 次 对 角 线 上 元 素 
全 为 2. 

. 4. 某 货运 公司 需要 从 9 个 货运 订单 中 选 定 一 些 订单 作为 一 批 用 一 个 集装箱 发 送 ,以 
获得 最 大 利润 . 该 集装箱 的 最 大 装载 容积 (不 允许 重 码 堆放 ,所 以 这 里 以 底面 积 表示 ) 为 
1000m"” ,最 大 装载 重量 为 1200kg. 9 个 货运 订单 的 相关 信息 如 表 9. 5. 

5. 《指派 问题 ) 考 虑 指定 二 个 人 完成 2 项 任务 (每 人 单独 承担 一 项 任务 ) ,使 所 需 的 总 
完成 时 间 ( 成 本 ) 尽 可 能 短 . 已 知 某 指派 问题 的 有 关 数 据 ( 每 人 完成 各 任务 所 需 的 时 间 ) 如 
表 9. 6 所 示 , 试 求解 该 指派 问题 . 
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家 9.5 


1 15 18 21 24 
2 19 23 | 22 18 
3 26 18 16 19 
4 19 21 23 17 


6. 《二 次 指派 问题 ) 某 公司 指派 x 个 员工 到 个 城市 工作 (每 个 城市 单独 一 人 ), 希 望 
使 所 花费 的 总 电话 费用 尽 可 能 少 . n 个 员工 两 两 之 间 每 个 月 通话 的 时 间 表示 在 下 面 的 算 
阵 的 上 三 角 部 分 (因为 通话 的 时 间 和 矩阵 是 对 称 的 ,没有 必要 写 出 下 三 角 部 分 ) ,n 个 城市 两 
两 之 间 通 话费 率 表示 在 下 面 矩 阵 的 下 三 角 部 分 (同样 道理 ,因为 通话 的 费 率 矩阵 是 对 称 
的 ,没有 必要 写 出 上 三 角 部 分 )， 试 求解 该 二 次 指派 问题 (如 果 你 的 软件 解 不 了 这 么 大 规 
模 的 问题 , 那 就 只 考虑 最 前 面 的 若干 员工 和 城市 ). 


[0% -5 3 3 79 37 3 2 90 
70 证 
4 Br $09 BD 33 TO 3 
6 2 N00 84 L804 
8 
8 5 4 6 6 0 4 8 0 3 
8 6 7 9 4 3 0 7 9 5 
5- 8 用 05 
0 
5 6 7 6 6 2 8 8 9 0 


7. 一 家 出 版 社 准 备 在 某 市 建立 两 个 销售 代理 点 ,向 ?个 区 的 大 学 生 售 书 ,每 个 区 的 


大 学 生 数 量 ( 单 位 : 千 人 ) 已 经 表示 在 图 9. 5 上 . 每 个 销售 代理 点 
区 的 大 学 生 售 书 , 这 两 个 销售 代理 点 应 该 建 在 何 处 ,才能 使 所 能 供应 的 大 学 生 的 数量 最 


向 本 区 和 一 个 相 邻 
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图 9.5 


大 . 建立 该 问题 的 整数 线性 规划 模型 并 求解 . 


8. 某 储蓄 所 每 天 的 营业 时 间 是 上 午 9 时 到 下 午 5 时 .根据 经 验 , 每 天 不 同时 间 段 所 


需要 的 服务 员 数 量 如 表 9. 7. 
表 9.7 
时 间 段 /h 


服务 员 数 量 


储 车 所 可 以 雇用 全 时 和 半 时 两 类 服务 员 . 全 时 服务 员 每 天 报酬 100 元 ,从 上 午 9 时 到 下 午 
5 时 工作 ,但 中 午 12 时 到 下 午 2 时 之 间 必 须 安排 1h 的 午餐 时 间 . 储蓄 所 每 天 可 以 雇用 不 
超过 3 名 的 半 时 服务 员 ,每 个 半 时 服务 员 必 须 连 续 工作 4h, 报 酬 40 元 . 问 该 储蓄 所 应 如 
何 雇用 全 时 和 半 时 两 类 服务 员 . 如 果 不 能 雇用 半 时 服务 员 , 每 天 至 少 增加 多 少 费 用 . 如 果 
雇用 半 时 服务 员 的 数量 没有 限制 ,每 天 可 以 减少 多 少 费 用 . 

9. (原油 采购 与 加 工 ) 某 公司 用 两 种 原油 (A 和 B) 混 合 加 工 成 两 种 汽油 ( 甲 和 乙 )， 
甲 、. 乙 两 种 汽油 含 原油 A 的 最 低 比例 分 别 为 50% 和 60%, 每 辆 售 价 分 别 为 4800 元 和 
5600 元 . 该 公司 现 有 原油 A 和 B 的 库存 量 分 别 为 500t 和 1000t, 还 可 以 从 市 场 上 买 到 不 
超过 1500t 的 原油 A. 原油 A 的 市 场 价 为 : 购买 量 不 超过 500t 时 的 单价 为 10000 元 /t; 购 
买 量 超过 500t 但 不 超过 1000t 时 ,超过 500t 的 部 分 8000 元 /t; 购 买 量 超过 1000t 时 , 超 
过 1000t 的 部 分 6000 元 /t. 该 公司 应 如 何 安排 原油 的 采购 和 加 工 ? 请 分 别 建立 连续 规划 
和 整数 规划 模型 来 求解 这 个 问题 . 

10. 生产 裸 铜 线 和 塑 包 线 的 工艺 如 图 9.6 所 示 : 

某 厂 现 有 工 型 拉丝 机 和 塑 包 机 各 一 台 , 生 产 两 种 规格 的 裸 铜 线 和 相应 达到 两 种 规格 
的 塑 包 线 ,没有 拉丝 塑 包 联合 机 (简称 联合 机 ). 由 于 市 场 需求 扩大 和 现 有 塑 包 机 设备 陈 
旧 ,计划 新 增 卫 型 拉丝 机 或 联合 机 (由 于 场地 限制 ,每 种 设备 最 多 1 台 ) ,或 改造 塑 包机 ,每 
种 设备 选用 方案 及 相关 数据 如 表 9. 8: 

已 知 市 场 对 两 种 规格 裸 铜 线 的 需求 分 别 为 3000km 和 2000km, 对 两 种 规格 塑 包 线 的 
需求 分 别 为 10000km 和 8000km. 按照 规定 ,新 购 及 改进 设备 按 每 年 5% 提取 折旧 费 , 老 
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~ 裸 钢 线 


拉丝 机 


| 型 包机 


联合 机 逆 包 线 


9.6 


设备 不 提 ; 每 台 机 器 每 年 最 多 只 能 工作 8000h. 为 了 满足 需求 ,确定 使 总 费用 最 小 的 设备 


选用 方案 和 生产 计划 . 
表 9.8 
拉丝 机 塑 包 机 联合 机 
方 案 
| 原 有 I 型 新 购 工 型 原 有 改造 新 购 
方案 代号 1 2 3 4 5 
所 需 投资 /万 元 0 20 0 10 50 
运行 费用 /元 /bh 5 7 8 8 12 
国定 费用 /万 元 /年 3 5 8 10 14 
规格 1 生产 效率 /m/h 1000 1500 1200 1600 1600 
规格 2 生产 效率 /m/h 800 1400 1000 1300 1200 
废品 率 /% 2 2 3 3 3 
每 千 米 废品 损失 /元 ”30 30 50 50 50 
OO OOOO 
O GO 
CO O 
OO OO 
模式 1 模式 2 


模式 4 
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11. 〈 钢 管 下 料 ) 某 钢管 零售 商 从 钢管 厂 进货 ,将 钢管 按照 顾客 的 要 求 切割 后 售 出 . 从 
钢管 厂 进货 时 得 到 的 原料 钢管 长 度 都 是 1850mm. 现 有 一 客户 需要 15 根 290mm、28 根 
315mm、21 根 350mm 和 30 根 455mm 的 钢管 . 为 了 简化 生产 过 程 ,规定 所 使 用 的 切割 模 
式 的 种 类 不 能 超过 4 种 ,使 用 频率 最 高 的 一 种 切割 模式 按照 一 根 原料 钢管 价值 的 1/10 增 
加 费用 ,使 用 频率 次 之 的 切割 模式 按照 一 根 原料 钢管 价值 的 2/10 增加 费用 ,以 此 类 推 , 且 
每 种 切割 模式 下 的 切割 次 数 不 能 太 多 (一 根 原 料 钢管 最 多 生产 5 根 产 品 ). 此 外 ,为 了 减少 
余 料 浪费 ,每 种 切割 模式 下 的 余 料 浪费 不 能 超过 100mm. 为 了 使 总 费用 最 小 ,应 如 何 
下 料 . 

12. ( 易 拉 挫 的 下 料 ) 某 公司 采用 一 套 冲 压 设备 生产 一 种 把 装 饮 料 的 易 拉 能 ,这 种 易 
拉 饶 是 用 镀 锡 板 冲 压制 成 的 . 易 拉 饶 为 圆柱 形 , 包 括 饶 身 、 上 盖 和 下 底 , 饶 身高 10cm, 上 羡 
和 下 底 的 直径 均 为 5cm. 该 公司 使 用 两 种 不 同 规格 的 镀 锡 板 原料 ,规格 1 的 镀 锡 板 为 正方 
形 , 边 长 24cm; 规 格 2 的 贸 锡 板 为 长 方形 ,长 、 宽 分 别 为 32cm 和 28cm. 由 于 生产 设备 和 生 
产 工 艺 的 限制 ,对 于 规格 1 的 镀 锡 板 原 料 , 只 可 以 按照 图 9.7 中 的 模式 1,2 或 3 进行 冲 
压 ;对 于 规格 2 的 镀 锡 板 原料 只 能 按照 模式 4 进行 冲压 . 使 用 模式 1,2,3,4 进行 每 次 冲压 
所 需要 的 时 间 分 别 为 1. 5s,2s,1s,3s. 、 

该 工厂 每 周 工 作 40h, 每 周 可 供 使 用 的 规格 1,2 的 镀 锡 板 原料 分 别 为 5 万 张 和 2 万 
张 . 目前 每 只 易 拉 镀 的 利润 为 0. 10 元 ,原料 余 料 损失 为 0. 001 元 / cm: (如 果 周 末 有 镶 
身 、 上 盖 或 下 底 不 能 配套 组 装 成 易 拉 饶 出 售 ,也 看 作 是 原料 余 料 损失 ), 问 工厂 应 如 何 安排 
每 周 的 生产 ? 
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数据 的 统计 与 分 析 


随 着 计算 机 技术 的 发 展 和 普及 ,数据 信息 越 来 越 大 量 和 频繁 地 进入 人 们 的 日 常生 活 : 
从 超市 收 款 台 处 成 千 上 万 顾客 的 购物 记录 ,到 生产 车 间 工 艺 过 程 和 产品 检验 的 情况 报表 ; 
从 政府 机 关 收 集 的 人 口 .交通 .教育 .卫生 等 方面 的 统计 数字 ,到 经 常见 诸 报刊 的 关于 市 民 
的 收入 支出、 偏好 、 见 解 等 的 抽样 调查 结果 . 杂乱 `. 浩 涂 的 数据 如 不 及 时 地 加 以 有 效 的 整 
理 和 分 析 , 既 不 能 发 挥 它们 应 有 的 作用 ,还 会 给 人 们 造成 越 来 越 大 的 负担 . 

一 般 说 来 ,数据 的 采集 与 统计 处 理 本 质 上 可 分 为 两 类 . 不 妨 用 以 下 的 例子 来 说 明 . 

1. 车 间 用 两 种 办 法 统计 当天 产品 的 次 品 率 : 

(1) 对 生产 的 全 部 1000 件 产品 逐一 检验 ,发 现 18 件 次 品 , 得 到 次 品 率 为 1.8%; 

(2) 从 全 部 产品 中 随机 抽取 100 件 检 验 ,发 现 2 件 次 品 , 得 到 次 品 率 为 2%. 

2. 行政 区 用 两 种 办 法 统计 每 位 居民 的 月 平均 支出 : 

(1) 对 金 区 居民 逐一 调查 ,得 到 月 平均 支出 为 828 元 ; 

(2) 随机 调查 了 200 位 居民 ,得 到 月 平均 支出 为 ?788 元 . 

容易 看 出 ,两 个 例子 的 第 1 种 办 法 是 一 般 意 义 的 统计 ,其 结果 是 完全 确定 的 ,而 第 2 
种 办 法 得 到 的 结果 是 随机 的 . 怎样 用 它 来 估计 整体 的 状况 (全 部 产品 的 次 品 率 ,全 体 居民 
的 月 平均 支出 ) 是 数理 统计 (以 下 简称 统计 ) 的 任务 . 

在 实际 生活 中 , 当 研 究 对 象 的 数量 很 大 时 ,不 可 能 或 者 不 必要 对 其 全 体 进 行 考察 (两 
个 例子 中 的 第 1 种 办 法 ), 部 分 抽样 的 结果 必定 包含 着 偶然 性 (两 个 例子 中 的 第 2 种 办 
法 ). 此 外 ,在 诸如 气象 预报 .零件 测试 .地 质 勘探 ,市场 预测 ,以 及 复杂 的 生产 工艺 流程 中 ， 
无 法 控制 .不 可 预见 的 不 确定 因素 的 普遍 存在 ,也 使 所 得 数据 的 随机 性 不 可 避免 .因此 统 
计 在 现实 中 有 着 广泛 的 应 用 . 

概率 论 是 统计 的 理论 基础 ,这 个 实验 结合 统计 的 基本 概念 ,介绍 概率 论 的 一 些 相关 知 
识 . 以 下 10. 1 节 提 出 几 个 经 过 简化 的 包含 随机 性 的 实际 问题 ,并 做 简单 分 析 ,10. 2 节 介 
绍 数 据 的 整理 和 描述 ,10. 3 节 给 出 随机 变量 .概率 分 布 .期 望 ,方差 等 基本 概念 ,并 介绍 
MATLAB 统计 工具 箱 的 使 用 ,10. 4 节 是 随机 数 的 一 个 应 用 : 用 随机 模拟 计算 数值 积分 ， 
10.5 节 讨 论 10.1 节 中 问题 的 求解 .10. 6 节 布 置 实验 练习 . 


10.1 实例 及 其 分 析 


10.1 实例 及 其 分 析 


10.1.1 报 童 的 利润 


问题 茶 报章 每 天 从 发 行商 处 购 进 报纸 零售 ,晚上 将 没有 卖 掉 的 报纸 退回 . 如 果 每 份 
报纸 的 购 进 价 为 a, 每 份 报纸 的 零售 价 为 6, 每 份 报纸 的 退回 价 (发 行商 返回 报 童 的 钱 ) 为 
Cc, 且 满 足 6 宇 a 之 c. 每 天 报纸 的 需求 量 是 随机 的 . 为 了 获得 最 大 的 利润 ,该 报 童 每 天 应 购 进 
多 少 份 报纸 ? 

为 了 掌握 需求 量 的 随机 规律 ,可 以 用 收集 历史 资料 或 向 其 他 报 童 调查 的 办 法 作 市 场 
预测 ,假设 已 经 得 到 159 天 报纸 需求 量 的 情况 如 表 10. 1. 

表 10.1 159 天 报纸 需求 量 的 分 布 情况 
180 一 200 一 220~ | 240~ 260 一 
32 35 20 15 8 
表 中 需求 量 在 100~119 的 有 3 天 ,其余 类 推 ， 

根据 这 些 数据 ,并 假定 a=0.8 元 ,6==1 元,c 二 0.75 元 ,为 报 童 提供 最 佳 决 策 . 

分 析 ”由 于 每 天 报纸 的 需求 量 是 随机 的 ,使 得 报章 每 天 的 利润 也 是 随机 的 ,所 以 只 能 
以 长 期 售 报 过 程 中 每 天 的 平均 利润 最 大 为 目标 ,确定 最 佳 决 策 . 

对 表 中 提供 的 数据 做 进一步 的 加 工 (将 在 10. 5 节 进 行 ) ,可 以 得 到 每 天 需求 量 为 7 的 
概率 , 记 作 f(r),r 二 0, 1, 2,…, 虽 然 r 存在 上 限 , 但 r 很 大 时 f(r) 将 很 小 ,以 后 会 看 到 考 
虑 r 一 oo 将 使 计算 更 为 方便 . 

记 报 童 每 天 购 进 报纸 的 份 数 为 n, 当 rr 过 n 时 报 童 售 出 7 份 ,退回 nn 一 r 份 , 而 每 售 出 1 
份 报 童 赚 65 一 a, 退 回 1 份 报 童 赔 a 一 c, 所 以 报 童 的 利润 为 (6 一 a)r 一 (a 一 0)(n 一 7); 当 7 
n 时 报 童 将 购 进 的 n 份 全 部 售 出 ,利润 为 n(5 一 a). 在 这 两 种 情况 下 将 利润 与 需求 概率 了 
《7) 相 乘 并 求 和 ,就 得 到 报 童 每 天 的 平均 利润 VCn), 即 


Vln) = Fre a)r— (a—c)(n 二 (1) 
问题 化 为 求 n 使 V(n) 最 大 . 我们 将 在 10. 5 节 继 续 讨 论 ， 
10.1.2 路 灯 更 换 策 略 


问题 ” 某 路 政 部 门 负 责 一 条 街 的 路 灯 维护 . 更 换 路 灯 时 ,需要 专用 云梯 车 进行 线路 检 
测 和 更 换 娄 泡 ,向 相应 的 管理 部 门 提出 电力 使 用 和 道路 管制 申请 ,还 要 向 雇用 的 各 类 人 员 
支付 报酬 等 ,这 些 工作 需要 的 费用 往往 比 灯泡 本 身 的 费用 更 高 ,灯泡 坏 1 个 换 1 个 的 办 法 
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是 不 可 取 的 . 根据 多 年 的 经 验 , 他 们 采取 整 批 更 换 的 策略 , 即 到 一 定 的 时 间 , 所 有 灯泡 无 论 
好 与 坏 全 部 更 换 . 

上 级 管理 部 门 通过 监察 灯泡 是 否 正常 工作 对 路 政 部 门 进行 管理 ,一 旦 出 现 1 个 灯泡 
不 亮 ,管理 部 门 就 会 按照 折合 计时 对 他 们 进行 罚款 . 路 政 部 门面 临 的 问题 是 ,多 长 时 间 进 
行 一 次 灯泡 的 全 部 更 换 , 换 早 了 ,很 多 灯泡 还 没有 坏 ; 换 晚 了 ,要 承受 太 多 的 罚款 . 

分 析 ”全 部 更 换 一 次 灯泡 的 时 间 不 妨 称 为 更 换 周期 ,应 以 路 政 部 门 支 出 的 总 费用 最 
小 为 目标 ,确定 最 佳 的 更 换 周期 . 总 费用 包括 更 换 灯 泡 的 费用 和 承受 的 罚款 两 部 分 ,前 者 
是 确定 的 ,而 后 者 与 灯泡 的 寿命 有 关 . 根据 常识 ,灯泡 的 寿命 是 随机 的 ,在 平均 值 附近 有 较 
大 的 波动 ,需要 通过 调查 研究 确定 灯泡 寿命 的 随机 规律 ( 像 报 童 利润 问题 中 报纸 需求 量 的 
概率 一 样 ), 再 计算 由 于 寿命 小 于 更 换 周期 导致 的 (平均 ) 罚 款 . 我 们 将 在 10. 5 节 继 续 


讨论 . 
10.2 数据 的 整理 和 描述 


10.2.1 数据 的 收集 和 样本 的 概念 


数据 是 多 种 多 样 的 ,我 们 总 是 为 了 某 种 目的 而 收集 数据 ,请 看 以 下 的 例子 ， 

例 1 菜 银行 为 使 顾客 感到 亲切 以 吸引 更 多 的 资金 ,计划 对 柜台 的 高 度 进行 调整 . 银 
行 随机 选 了 50 名 顾客 进行 调查 ,测量 每 个 顾客 感觉 舒适 时 的 柜台 高 度 , 表 10. 2 为 得 到 的 
数据 . 银行 怎样 依据 它 确 定 柜台 高 度 呢 ? 


表 10.2 50 名 顾客 感到 舒适 的 柜台 高 单位 : cm 
100 110 136 97 104 100 95 120 119 99 
126 113 115 108 93 116 102 122 121 122 
二 a | 
118 117 114 106 110 119 127 119 125 119 
105 95 117 109 140 121 122 131 108 120 
115 112 130 116 119 134 124 128 115 110 | 


例 2 为 了 比较 两 个 班 的 学 习 状 况 , 同 一 份 试卷 的 一 次 考试 成 绩 如 表 10. 3. 根据 这 些 
数据 评价 两 个 班 的 学 习 状 况 是 否 有 差距 ? 

例 3 粮食 加 工厂 一 台 包 装机 的 设计 指标 为 每 袋 50kg, 且 包装 偏差 不 超过 1%. 为 了 
监测 包装 机 的 运行 是 否 正常 ,随机 抽取 20 袋 粮食 ,其 重量 如 表 10.4. 如 何 由 此 推断 机 器 
的 运行 状况 ? 
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表 10.3 两 个 班 的 一 次 考试 成 绩 


序号 1 2 3 4 5 6 7 8 9 10 11 | 12 | 13|14 15|16 


甲 班 92 | 88 |85 | 92 | 95 | 79 | 84|87 | 88 165 |93 1 73188187 |94 180 


乙 班 84 | 83|182185 82181 82|190184178175|183178185 184 | 79 


了 
序号 17 |18119|120121122123|24|125126127 128|129130131 1 32 


甲 班 69 |86|188178179168188187 |155|193179|185 |90153 |99181 


乙 班 85 | 73 | 90 | 77 181 | 82 182 |80 86183177 178 


表 10.4 20 袋 粮 食 的 重量 单位 : kg 


49.97 | 50.26 | 50. 14 


49. 65 48. 67 | 50. 10 50. 23 50. 95 50. 95 


| 
49. 85 50. 58 49.53 51.75 49. 89 50.09 50. 85 50. 05 49. 92 49.33 


上 面 几 个 实例 给 出 的 数据 有 以 下 的 共同 特点 . 
首先 ,收集 到 的 数据 背后 都 蕴藏 着 更 大 量 的 数据 , 那 是 人 们 的 研究 对 象 . 例 1 只 测试 

了 50 名 顾客 ,而 银行 有 更 大 的 顾客 群体 ; 例 2 只 是 一 次 考试 的 成 绩 ,可 以 进行 任意 多 次 考 
试 ; 例 3 也 可 以 收集 更 多 的 数据 . 研究 对 象 全 体 的 集合 称 为 总 体 (或 母体 ), 总 体 的 一 个 基 
本 组 成 单位 , 即 每 一 个 数据 称 为 一 个 个 体 ,总 体 可 认为 包含 无 穷 多 个 个 体 . 若 于 个 体 的 集 
合 ,如 每 个 例子 给 出 的 一 组 数据 , 称 为 样本 , 若 样 本 包含 个 个 体 , 称 n 为 样本 容量 . 

第 二 ,收集 到 的 数据 是 随机 的 ,不 确定 的 . 例 1 若 选 取 另 外 50 名 顾客 进行 调查 ,会 得 
到 不 同 的 数据 ;对 于 例 2 ,每 考 一 次 都 可 能 得 到 不 同 的 结果 . 于 是 ,一 次 试验 从 总 体 中 得 到 
的 样本 是 一 组 具体 的 数据 ,不 同 的 试验 相当 于 从 总 体 中 随机 选取 样本 ， 

第 三 ,每 个 数据 的 选取 是 相互 独立 的 . 例 1 的 50 名 顾客 对 合适 柜台 高 度 的 要 求 互 不 


相关 ; 例 2 的 各 个 学 生 的 考试 成 绩 也 无 联系 , 于 是 ,样本 是 由 一 些 相互 独立 的 个 体 组 成 的 ， 


按照 概率 论 的 观点 ,总 体 可 以 看 作 一 个 随机 变量 , 记 作 XX, 每 个 个 体 作为 这 个 随机 变 
量 的 一 个 实现 , 记 作 ri 一 1，2,…，7z) ,看 作 与 总 体 有 相同 分 布 的 随机 变量 (分 布 的 概念 
将 在 10. 3 节 介 绍 , 这 里 不 妨 理解 为 有 相同 的 统计 规律 ), 样 本 则 是 一 组 相互 独立 的 、 同 分 
布 的 随机 变量 , 记 作 z= (zk ，zz，…，zn). 

样本 是 统计 研究 的 主要 对 象 ,可 以 说 ,统计 的 基本 任务 就 是 从 样本 推断 总 体 . 由 于 样 
本 的 随机 性 ,推断 的 结果 不 可 能 是 精确 的 ,应 该 允许 有 偏差 ,或 者 有 错误 , 当然 ,统计 方法 
会 给 出 偏差 的 大 小 和 错误 的 概率 . 


10.2.2 数据 的 整理 、 频 数 表 和 直方 图 
原始 数据 虽然 包含 了 总 体 的 信息 ,但 常常 是 杂乱 无 章 的 , 像 表 10. 2 到 表 10. 4 那样 . 
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报刊 上 一 些 公开 发 表 的 数据 常常 是 经 过 整理 的 ,能 给 人 们 以 比较 清晰 的 认识 ,例如 ,2003 
年 5 月 6 日 公布 的 北京 地 区 SARS 患者 的 按 年 龄 分 布 数据 见 表 10. 5. 


表 10.5 北京 地 区 SARS 患者 的 统计 数据 {截至 2003 年 5 月 5 日 ) 


年 龄 / 岁 


人 数 / 人 24 337 1897 
17.77 


比例 /% 


观察 表 10. 5 的 数据 ,很 容易 知道 ,21~50 岁 的 中 青年 患者 大 约 占 总 发 病人 数 的 3/4， 
提醒 民众 中 青年 是 易 感 人 群 

频数 表 和 直方 图 是 对 数据 进行 初步 整理 的 两 种 办 法 . 

将 数据 的 取 值 范围 划分 为 若干 个 区 间 , 然 后 统计 这 组 数据 在 每 个 区 间 中 出 现 的 次 数 ， 
称 为 频数 ,得 到 一 个 频数 表 . 对 于 例 1, 可 以 这 样 产生 它 的 频数 表 : 先 找 出 表 10. 2 数据 中 


的 最 小 值 93 和 最 大 值 140, 将 区 间 [93,140] 等 分 成 N( 比 如 10) 个 子 区 间 ,每 个 子 区 间 用 
它 的 中 点 表示 ,然后 统计 数据 在 每 个 子 区 间 中 出 现 的 次 数 , 就 得 到 表 10. 6. 类 似 地 ,对 于 
例 3, 若 分 5 个 子 区 间 ,得 到 表 10. 7. 

表 10.6 柜台 高 度 频数 表 ( 例 1) 


123.55 | 128. 25 | 132. 95 
| 


用 这 样 初步 整理 后 的 数据 可 以 推测 出 总 体 的 某 些 简单 性 质 . 如 表 10. 6 表明 选择 柜台 
高 度 在 107. 10 至 125. 90 的 有 31 人 , 占 总 人 数 的 62% ,柜台 高 度 设计 在 这 个 范围 内 ,会 
得 到 大 多 数 顾客 的 满意 。 

为 了 更 加 直观 ,可 以 用 图 的 形式 显示 频数 表 . 以 数据 的 取 值 为 模 坐 标 ,频数 为 纵 坐 标 ， 
画 出 一 个 台阶 形 的 图 , 称 为 直方 图 (histogram) ,或 频数 分 布 图 . 表 10.6 和 表 10.7 的 直方 
图 分 别 为 图 10. 1 和 图 10. 2. 

若 样 本 容量 不 大 ,能 够 手工 做 出 频数 表 和 直方 图 , 当 样 本 容量 较 大 时 ,可 以 借助 计算 
机 完成 ( 见 10. 2. 4 节 ). 
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图 10.1 柜台 高 度 直 方 图 图 10.2 包装 重量 直方 图 
10.2.3 统计 量 


用 频数 表 ( 表 10. 6) 和 直方 图 (图 10. 1) 还 无 法 直接 回答 例 1 关于 确定 柜台 高 度 的 问 
题 ,众所周知 ,解决 这 个 问题 常用 的 办 法 是 计算 表 10. 2 中 50 名 顾客 感到 舒适 的 柜台 高 度 
的 平均 值 . 
对 于 一 个 容量 为 n 的 样本 ( 即 一 组 数据 )x 二 (zi，zs，…， zx,), 它 的 平均 信 (mean, 简 
称 样本 均值 , 记 作 zx) 定义 为 


二 二 is (2) 


通过 计算 得 到 表 10. 2 数据 的 平均 值 为 x 二 115. 26 ,可 作为 设计 柜台 高 度 的 参考 值 . 

类 似 地 ,为 了 比较 例 2 中 两 个 班 的 学 习 状 况 , 我 们 首先 分 别 计算 表 10. 3 两 个 班 考试 
成 绩 的 平均 值 ,得 到 甲 班 的 平均 值 为 82. 75 分 , 乙 班 的 平均 值 为 81.75 分 ,大 致 表明 甲 班 
的 平均 成 绩 稍 高 于 乙 班 . 仔细 研究 数据 还 会 发 现 , 围 班 中 90 分 以 上 的 有 7 人 ,但 有 2 人 不 
及 格 , 分 数 比 较 分 散 , 而 乙 班 全 在 73 分 到 90 分 之 间 , 分 数 相 对 集中 ,两 个 班 考 试 成 绩 的 这 
种 差别 可 以 从 它们 的 直方 图 (图 10.3) 明 显 地 看 出 .为 了 描述 数据 的 这 种 分 散 程度 (统计 
上 称 为 变异 ) ,统计 上 引入 标准 差 的 概念 . 

对 于 样本 z 一 (zl ，zs，…，Z;) , 记 它 的 标准 差 (standard deviation, 记 作 s) 定 义 为 


:= [a a] = [LD DD). 二 曙 
- i=1 


标准 差 是 x,(i 二 1,2,…,n) 与 均值 x 偏离 程度 的 度量 , 分 别 计算 表 10. 3 两 个 班 考试 成 绩 
的 标准 差 ,得 到 甲 班 的 标准 差 为 10. 98 分 , 乙 班 的 标准 差 为 3. 98 分 ,表明 甲 班 成 绩 的 分 散 
程度 远大 于 乙 班 . 


@ 《〈3) 式 中 * 是 无 偏 的 ( 见 11. 2. 2 节 ) ,以 下 若 不 特别 指明 ,标准 差 均 指 *, 当 ? 较 大 时 * 与 si 实际 上 差别 很 小 、 
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图 10.3 甲乙 两 个 班 的 成 绩 分 布 ( 左 侧 为 甲 班 ) 


样本 均值 和 标准 差 是 两 个 最 常用 、 最 重要 的 统计 量 .所谓 统 计量 就 是 由 样本 加 工 出 来 
的 、 集 中 反映 样本 数量 特征 的 函数 ,在 总 体 的 参数 估计 和 假设 检验 中 起 着 重要 作用 . 

统计 量 大 致 可 分 为 三 类 ; 表示 位 置 的 ,表示 变异 程度 的 ,以 及 表示 分 布 形 状 的 . 

表示 位 置 的 除了 均值 以 外 ,还 有 中 位 数 . 中 位 数 (median) 是 将 数据 由 小 到 大 排序 后 
处 于 中 间 位 置 的 那个 数值 . 当 样本 容量 ”为 奇数 时 ,中 位 数 惟一 确定 ; 当 为 偶数 时 ,定义 
为 中 间 两 个 数 的 平均 值 . 

表示 数据 变异 程度 的 除了 标准 差 以 外 ,还 有 极 差 和 方差 . 极 差 (range) 是 zi ，zs ，…， 
ZX, 的 最 大 值 与 最 小 值 之 差 .方差 (variance) 是 标准 差 的 平方 5. 

表示 数据 分 布 形状 的 统计 量 有 偏 度 和 峰 度 , 当 x 充分 大 时 , 偏 度 (skewness, 记 作 g1) 
和 和 峰 度 (kurtosis , 记 作 g;) 可 分 别 表示 为 


i Ce 六 4 
gi pe 元 )3， ga BT (4) 


偏 度 反 映 分 布 的 对 称 性 ,g: 之 0 称 为 右 偏 态 ,此 时 数据 位 于 均值 右边 的 比 左边 的 多 ; 
si<0 称 为 左 偏 态 ,情况 相反 ;而 8; 接近 0 则 可 认为 分 布 基本 上 是 对 称 的 . 

峰 度 是 分 布 形状 的 另 一 种 度量 ,常见 的 正 态 分 布 (将 在 10. 3 节 介 绍 ) 的 峰 度 为 3, 若 
8&: 比 3 大 得 多 ,表示 分 布 有 沉重 的 尾巴 ,说 明 样 本 中 含有 较 多 远离 均值 的 数据 ,因而 峰 度 
可 以 用 作 衡 量 偏离 正 态 分 布 的 尺度 之 一 . 


10.2.4 MATLAB 命令 


MATLAB 的 统计 工具 箱 (statistics toolbox) 提 供 了 许多 统计 计算 的 程序 ,用 于 数据 
搞 述 的 常用 命令 见 表 10. 8( 实 际 上 表 中 一 些 命令 如 均值 .标准 差 在 MATLAB 中 而 不 在 
统计 工具 箱 内 ). z 


10 


表 10.8 数据 描述 的 常用 命令 


2 数据 的 整理 和 描述 


命 令 名 称 渝 人 输 出 注意 事项 
[Ln, yj = hist(x, 频数 表 x: 原始 数据 行 向 量 | n: 频数 行 向 量 [n,yj= hist(x) 中 K 取 
k) 和 k: 等 分 区 间 数 y: 区 间 中 点 行 向 量 | 默认 值 10 
histCx,k) 直方 图 同上 直方 图 同上 
mean(Cx) 均值 x: 原始 数据 行 向 量 | 均值 x 
median(x) 中 位 数 同上 中 位 数 
range(x) 极 差 同上 极 差 

| ys 3 
elds 标准 差 | 同上 标准 差 Nd 
var (x) 方差 ”| 同上 方差 5 var(x11): 即 强 

_skewness(x) 偏 度 同上 偏 度 gi 

kurtosisCx) 峰 度 同上 峰 度 gs 


”用 下 面 的 程序 求 例 1 的 频数 表 、 直 方 图 及 均值 等 统计 量 ; 


X =[100 110 136 97 104 100 95\120 119 99 ... 
126 113 115 108 93 116 102 122 121 122 ... 
118 117 114 106 110 119 127 119 125 119 ... 
105 95 117 109 140 121 122 131 108 120 ... 
115 112 130 116 119 134 124 128 115 110]; 


% 输入 表 10.2 数据 ,…. 为 续 行 符号 


LN,Yj=hist(X), 


histC(X),， 


x1= mean(X) ,x2 = median(X) 


% 频数 表 
% 直方 图 
% 各 个 统计 量 


x3=range(X) ,x4= std(X) 
x5= skewness(X) ,x6= kurtosis(X) 


输出 图 10. 1 和 下 列 结果 : 


N=44368125422 

Y= 95.3500 100.0500 104.7500 109.4500 114.1500 118.8500 123.5500 128.2500 132.9500 
137.6500 

x1 = 115.2600,x2 =116.5000 

x3 三 47,x4 = 10.9690 

x5 三 一 0.0971,x6 =2.6216 


MATLAB 数据 输入 有 直接 输入 和 文件 输入 两 种 方式 . 直接 输入 适合 数据 规模 不 大 


及 调试 程序 的 情况 ,上 面 就 是 直接 输入 . 当 数据 量 较 大 时 ,可 以 采用 文件 输入 方式 ,对 于 例 
1, 先 把 表 10. 2 数据 直接 写 人 一 个 M 文件 中 (每 个 数据 之 间 需 有 空格 ) ,命名 为 bankdata. m 


100 110 136 97 104 100 95 120 119 99 
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126 113 115 108 93 116 102 122 121 122 
118 117 114 106 110 119 127 119 125 119 
105 95 117 109 140 121 122 131 108 120 
115 112 130 116 119 134 124 128 115 110 


然后 在 程序 中 用 dlmread 命令 读 人 这 个 数据 文件 ,再 做 计算 ; 


A= dimread('bankdata. m'") ; % A 返回 bankdata.m 文件 中 的 5x10 矩阵 
X=[AC1, : ) A(2, ; ) A(3, : ) A(4, : ) A(5, :; )]; % 得 到 行 向 量 X, 以 下 与 上 面 的 程序 同 


10.3 随机 变量 的 概率 分 布 及 数字 特征 


10.3.1 频率 与 概率 


在 例 ] 确定 柜台 高 度 的 研究 中 , 表 10. 6 给 出 了 每 个 小 区 间 的 频数 ,容易 理解 , 随 着 测 
试 人 数 的 增加 ,各 个 小 区 间 的 频数 会 随 之 变 大 ,但 频数 占 总 人 数 的 比例 应 该 变化 不 大 .如 
前 所 述 , 一 个 数据 可 以 看 作 代 表 总 体 的 随机 变量 X 的 一 系列 实现 , 若 定义 样本 数据 在 一 
个 确定 区 间 (a,5j] 的 频数 与 样本 容量 n 的 比值 为 频率 , 记 作 /ao<< X 委 沪 , 则 


fla<X<O)=. (5) 


实践 表明 ,只 要 能 保证 抽取 样本 的 随机 性 和 独立 性 , 当 样 本 容量 无 限 增 大 时 ,频率 会 
趋向 一 个 确定 值 ,这 个 值 称 为 随机 变量 X 落 入 区 间 (a,b] 的 概率 (probability), 记 作 
P{la<X<b). 

如 果 X 在 实数 域 一 个 区 间 上 取 值 , 称 X 是 连续 随机 变量 . 例 1 的 柜台 高 度 可 视 为 连 
续 变 量 , 将 图 10.1 的 纵 坐 标 由 频数 换 成 频率 , 当 测 试 人 数 n 无限 增 加 时 ,频率 的 图 形 将 逐 
渐 向 连续 曲线 p(z) 人 逼近 ,如 图 10. 4 所 示 . 


10.3.2 概率 密度 与 分 布 函 数 


从 频率 与 概率 的 关系 看 出 ,可 以 合理 地 定义 连续 随机 变量 Xx 落 入 区 间 (a,5j 的 概 
ee dy et (6) 


称 pl(z) 为 随机 变量 X 的 概率 密度 函数 (probability density function, 简称 概率 密度 ) , 满 
ee Gs PP 


F(z) = P{X 去 z) = | BLE (7) 
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90 95 100 105 110 115 120 125 130 135 140 
图 10.4 例 1 的 频率 图 形 及 变化 趋势 


为 随机 变量 X 的 概率 分 布 函数 (cumulative distribution function) ,简称 分 布 函数 . 显然 ， 


.下 非 降 且 下 (一 co)=0,F(co)=1,P(a<X 雪 外 一 FFCO 一 FCa)， ,CD) 一 和 


10.3.3 期 望 和 方差 


概率 密度 和 分 布 函数 完整 地 描述 了 随机 变量 的 (随机 ) 变 化 规律 ,在 某 些 情况 下 只 需 
要 它 的 最 主要 的 数字 特征 ,这 就 是 期 望 (expectation) 和 方差. 
随机 变量 X 的 期 望 就 是 平均 值 的 意思 , 记 作 EX 或 ,用 概率 密度 函数 p(z) 定 义 为 


EX = Ia DC Es (8) 
方差 记 作 DX 或 varX ,或 于, 定义 为 
DX —| (x—EX)’p(z)dz. (9) 
方差 的 平方 根 c 称 为 均 方差 (标准 差 ). 由 (9) 式 可 以 得 出 方差 的 简化 计算 公式 
DX = EC(X— EX)’ ~ EX: — (EX)’. (10) 
当 随 机 变量 只 取 离 散 值 时 ， 其 期 望 和 方差 的 定义 及 计算 ,只 需 将 上 面 的 积分 改 为 求 和 
即 可 . 
期 望 和 方差 的 简单 性 质 
对 于 两 个 随机 变量 X, Y 和 任意 常数 cl ，cz ,有 
五 (ci 十 czY) = cEX+ cEY. (11) 


对 于 两 个 相互 独立 的 随机 变量 X,Y( 相 互 独立 的 概念 在 10. 3. 6 节 中 介绍 ,这 里 可 理 
解 为 彼此 无 关 的 意思 ) 和 任意 常数 c ，cs ,有 
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D(a¥X+eY) = cDX + eiDY. (12) 
(11) 式 ,(12) 式 可 以 推广 到 任意 多 个 随机 变量 的 情形 . 
将 上 述 性 质 用 于 样本 均值 x = D3 ,由 于 每 个 个 体 zx; 是 相互 独立 的 .与 总 体 同 分 
布 的 随机 变量 , 若 记 总 体 的 期 望 和 方差 为 EX 和 DX, 则 样本 均值 的 期 望 和 方差 为 


.开工 一 二 2 Ez, = EX, (13) 
i=1 
Dz 一 广 >JDr, = 2 . (14) 


(13) 式 , (14) 式 是 统计 中 非常 重要 的 结果 . 


10.3.4 常用 的 概率 分 布 


(1) 均匀 分 布 
当 随 机 变量 X 在 某 个 有 限 区 间 [a,5] 上 等 可 能 性 地 取 值 时 ,XX 用 入 多 亿 布 
(Cuniform distribution) , 记 作 X~U(Ca,p2)， 其 概率 密度 为 


ES rELa,b] 
el | a (15) 
0， 其 他 . 
UC(0, 2) 和 UC1, 5) 的 概率 密度 函数 图 形 由 图 10. 5 所 示 . 
0.5 上 区 0 
| | 
0.4 上 1 | 
1 1 
| | 
0.3 上 1 5) 
! 上 
02- |! | | | 
| | 
0.1 上 | | 1 
J 
0 h | 上 J 1 
11 0 1 2 3 4 5 6 


图 10.5 均匀 分 布 概率 密度 函数 


将 (15) 式 代 人 (8) 式 和 (10) 式 ,容易 算出 U(Ca,o) 的 期 望 和 方差 分 别 为 


_a+tvb _ ba)’ 
EX 一 一 ， DX 二 一 一 1 


当 计 算 保 留 小 数 点 后 4 位 数字 (第 5 de UC(—0.5X 
10- ,0.5X1071) ;车 班车 每 隔 a 分 钟 发 一 次 ,随意 到 达 的 乘客 的 候车 时 间 服 从 UC0, a). 


(16) 
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(2) 指数 分 布 
指数 分 布 (exponential distribution) 的 概率 密度 函数 为 
ee 0) 
plz) = | A (17) 
0， 其 他 . 


其 中 1(>0) 是 指数 分 布 的 惟一 参数 , 记 X 一 Exp(1).Exp(2) 和 Exp(4) 的 概率 密度 函数 
图 形 如 图 10. 6. 
将 (17) 式 代入 (8) 式 和 (10) 式 ,容易 算出 Exp 0) 的 期 望 和 方差 分 别 为 
EX = 71, DX = (18) 
一 些 电器 元 件 的 寿命 .排队 模型 中 的 服务 时 间 等 可 认为 服从 指数 分 布 . 


0.5 


0.4| 


0.3 | 


图 10.6 指数 分 布 概率 密度 项 数 图 形 


(3) 正 态 分 布 
正 态 分 布 (norm distribution) 的 概率 密度 函数 为 
1 (2 
Ee 一 人 一 由 ) ， 19 
plz) A | 019) 


记 为 X~ No) .曲线 p(xz) 旺 中 间 高 两 边 低 、 对 称 的 钟 形 ,如 图 10.7. pw 一 0,o=]1 的 正 
态 分 布 称 为 标准 正 态 分 布 . 正 态 分 布 又 称 为 高 斯 分 布 (Gaussian distribution). 

将 (19) 式 代入 (8) 式 和 (10) 式 ,容易 算出 N(Cpo) 的 期 望 和 方差 分 别 为 

Pe (20) 

正 态 分 布 是 最 常见 的 连续 型 概率 分 布 ,大 量 生 产 时 零件 的 尺寸 ,射击 时 弹 着 点 的 位 
置 , 仪 器 反复 量 测 的 结果 ,人 和 群 的 身高 .体重 等 ,多 数 情 况 下 都 服从 正 态 分 布 ,这 不 仅 是 观 
察 和 经 验 的 总 结 : 而 且 有 着 深刻 的 理论 依据 , 即 在 大 量 相互 独立 的 .作用 差不多 大 的 随机 
因素 影响 下 形成 的 随机 变量 ,其 极限 分 布 为 正 态 分 布 (这 一 结论 的 严格 叙述 见 概 率 论 的 中 
心 极限 定理 ). 
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0.3 上 


0.2 上 上 


4 ,Ns 


10.7 正 态 分 布 的 概率 密度 函数 图 形 


[2 


(4) x? 分 布 
车 Xi ,Xs，,…,，X, 为 相互 独立 、 服 从 标准 正 态 分 布 NC(0,1) 的 随机 变量 , 则 它们 的 平 


方 和 Y 一 六 X? 服从 分 布 , 记 作 YY- 好 (na wn 称 作 自由 度 
1 分 布 的 密度 函数 的 图 形 见 图 10. 8, 必 (nn) 的 期 望 是 , 当 增加 时 曲线 向 右 移动 ， 


且 变 平 
0 5 0 20 
图 10.8 vw 分 布 的 概率 密度 函数 图 形 
(5) zt 分布 
若 匀 ~N(0,1),Y~Y:(n), 且 相互 独立 , 则 本 = - 房 坟 服从 t 分 布 , 记 作 工 一 上 7z) ,7 称 


为 自由 度 .zt 分 布 又 称 学 生 (student) 分 布 ， 
ti 分 布 的 密度 函数 曲线 见 图 10. 9, 它 和 N(0,1) 曲 线形 状 相似 . 理论 上 ce 时 工 一 
tn)->N(0,1) ,实际 上 当 n 之 30 时 它 与 N(0,1) 就 相差 无 几 了 . 
(6) 三 分 布 
KX/n 


车头 ~~x* 《m1)，Y~x* (ns), 且 相互 独立 , 则 F= 字 J 服从 五 分布, 记 作 F~ Fln, 
za ) (mi ,nz) 称 为 自由 度 .下 分 布 的 密度 函数 曲线 见 图 10. 10. 


10.3 随机 变量 的 概率 分 布 及 数字 特征 


A(10, 5) 


0 | 1 Ds 1 
-6 和 2 0 2 4 6 0 0.5 1.0 1.5 2.0 235 3.0 


图 10.9 分 布 的 概率 密度 函数 图 形 图 10.10 下 分 布 的 概率 密度 函数 图 形 


除了 以 上 连续 随机 变量 的 概率 分 布 外 ,还 有 几 个 常用 的 离散 随机 变量 的 概率 分 布 . 
(7) 二 项 分 布 
如 果 一 次 实验 只 有 两 种 结果 : 成 功 和 失败 , 记 成 功 的 概率 为 p,q 二 1 一 p, nn 次 独立 实 
验 中 成 功 的 次 数 是 随机 变量 X,X 服从 二 项 分 布 (binomial distribution) ,有 
P{X=k) = Cprgrt, k=0,1,n (21) 
记 作 XX~B(n, p). 
将 (21) 式 代入 (8) 式 和 (10) 式 (积分 改 为 求 和 ), 可 以 算出 BC(n, p) 的 期 望 和 方差 分 
别 为 
EX =np, DX = npg. : (22) 
产品 检验 中 的 废品 个 数 、 独 立 射击 时 的 命中 次 数 等 都 服从 二 项 分 布 . 
(8) 泊 松 分 布 . 


当 二 项 分 布 的 n 一 oo0,np 一 (常数 ) 时 ,随机 变量 X 服从 泊 松 分 布 (Poisson. 


distribution) , 记 作 Poiss(4) ,有 
P{X = kk} = He7, k= 0,1,2,. (23) 
将 (23) 式 代入 (8) 式 和 (10) 式 (积分 改 为 求 和 ), 可 以 算出 Poiss(X) 的 期 望 和 方差 分 
别 为 
EX =1, DX=X. (24) 
服务 系统 在 -一 定时 间 内 接 到 的 呼唤 数 ,放射 性 物质 一 定时 间 内 发 射 的 粒子 数 等 服从 
泊 松 分 布 . 


10.3.5 MATLAB 命令 


MATLAB 统计 工具 箱 中 提供 约 20 种 概率 分 布 ,上 面 介 绍 的 8 种 分 布 MATLAB 命 
令 采 用 下 列 字 符 ( 见 表 10. 9): 
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表 10.9 


均匀 分 布 X 分布 二 项 分 布 | 泊 松 分 布 


符 unif exp | norm ] chi2 ] t | f | bino | poiss 


对 每 一 种 分 布 提供 5 类 运算 功能 ,采用 下 列 字符 ( 见 表 10. 10) : 


表 10.10 


功能 均值 与 方差 


字符 pdf cdf inv Stat rnd 


当 需 要 某 一 分 布 的 某 类 运算 功能 时 ,将 分 布 字符 与 功能 字符 连接 起 来 ,就 得 到 所 要 的 


命令 ,我 们 用 例子 来 说 明 . 


(1) 概率 密度 


y=normpdf(1.5,1,2) % 正 态 分 布 (j=1, oc 二 2) x=1.5 处 的 概率 密度 (标准 正 态 分 布 的 
H，0 可 省 略 》 
y=0.1933 


y= binopdf(5 : 8,20,0.2) % 二 项 分 布 (n= 二 20, p= 二 0.2) k 二 5, 6, 7, 8 的 概率 
y =0.1746 0.1091 0.0545 0.0222 | 

(2) 分 布 函数 

y=normcdf([ 一 10 1.5],0,2) % N(0,22)x= 一 1, 0, 1.5 处 的 分 布 函数 
y=0.3085 0.5000 0.7734 


y=fcdf(1,10, 50) % F 分布 ( 自 由 度 m=10, nz=50)x= 1 处 的 分 布 函数 

y =0.5436 

(3) 逆 概 率 分 布 

逆 概率 分 布 是 分 布 函数 F(x) 的 反 汞 数 , 即 给 定 概率 a, 求 满足 a 二 F(x。) = 


| ”pcz)dz 的 zx。. x 称 为 该 分 布 的 a 分 位 数 ， 


y= norminv(0.7734,0,2) % 概率 a 二 0.7734 的 N(0.2?)a 分 位 数 x。 
y= 1.5002 
y =tinv([0.3,0.999],10) % 概率 a 二 0.3,0.999 的 tf 分 布 (自由 度 n= 10)a 分 位 数 xs 


y= —0.5415 4.1437 


10.3 随机 变量 的 概率 分 布 及 数字 特征 


(4) 期 望 和 方差 

[m,vj=normstat(1,4) % 计算 N(1,4?) 的 期 望 和 方差 
m=1 v=16 

[m,v]=fstat(3,5) % 计算 F(3,5) 的 期 望 和 方差 


m=1.6667 v= 11.1111 

随机 数 生 成 的 用 法 与 上 类 似 ,非常 有 用 的 均匀 分 布 随机 数 的 用 法 将 在 10.4 说 明 . 

例 4 从 正 态 分 布 No ) 的 总 体 任 意 取 一 个 体 , 求 它 的 取 值 在 kw 士 c,w 士 2c,p 士 3c 
范围 内 的 概率 . 


解 Nie 度 (19)p(z) 一 -局 


Y=2— , 则 YY 服从 标准 正 态 分 布 , 即 Y~N(0,1), 分 布防 数 常 记 作 BCzx) ,于 是 
a = P(—l1<Y<1}= 08) 01)=1—26(—1) 

同 理 , Pty 一 2o 寺 Xpy+20)==1 一 26( 一 2),P{ly 一 30 人 Xp 二 30) 二 1 一 28( 一 3). 用 

MATLAB 编程 计算 这 些 概率 (分 别 记 作 P1,P2,P3) 如 下 : 


了 i , 若 作 变换 


P1=1~2 x*xnormcdf( 一 1)， 
P2=1—2x*xnormcdf( ~—2), 
P3=1—2xnormcdf( —3), 


得 到 Pl = 0.6827 P2=0.9545 P3 一 0.9973 

这 个 结果 给 出 了 实际 中 很 有 用 的 正 态 分 布 的 3c 准则 ; 车 一 个 容量 较 大 的 样本 数据 
来 自 正 态 分 布 Ny,o) 的 总 体 , 则 落 在 jy 士 o,w 填 20,1 士 30 范围 内 的 数据 分 别 约 占 68%、 
95%% 和 99.7% ,可 以 认为 几乎 全 部 都 在 w 士 3c 范围 内 . 

例 S 已 知 机 床 加 工 得 到 的 某 零 件 的 尺寸 服从 期 望 20cm， 均 方差 1. 5cm 的 正 态 
分 布 . 

(1) 任意 抽取 一 个 零件 , 求 它 的 尺寸 在 L19, 22j] 区 间 内 的 概率 . 

(2) 车 规定 尺寸 不 小 于 某 一 标准 值 的 零件 为 合格 品 , 要 使 合格 品 的 概率 为 0.9, 如 何 
确定 这 个 标准 值 ? 

(3) 独立 地 取 25 个 组 成 一 个 样本 , 求 样本 均值 在 [19, 22] 区 间 内 的 概率 . 

解 ” 零 件 尺 寸 服从 NC(20, 1.5:), 用 plz) 和 FCz) 分 别 表示 N(20, 1.5’) 的 概率 密 
度 和 分 布 淫 数 . 

(1) 零件 尺寸 在 L19, 22] 区 间 内 的 概率 为 

下 渤 | .pcz)dz = ly 


eg 


实验 10 数据 的 统计 与 分 析 


(2) 零件 为 合格 品 的 标准 值 zo 应 满足 | 
| aaar 二 0.9 或 25 0 


(3) 样本 均值 二 二 >)z, 是 相互 独立 的 \ 正 态 分 布 N(20，1. 57) 随 机 变量 的 线性 组 


合 , 仍 服从 正 态 分 布 , 其 期 望 和 方差 由 (13) 式 ,(14) 式 给 出 , 即 

09, 

| 25 | 5 ) 

样本 均值 在 [19, 22] 区 间 内 的 概率 Pi 可 以 类 似 于 (1) 式 求 出 . 
P,zo 和 Pi 用 MATLAB 编程 计算 如 下 : 


Ex = 20,Dz = 


P= normcdf(22,20,1.5) 一 normcdf(19,20,1.5) 
X0= norminv(0.1，20,1.5) 
P1= normcdf(22,20,1.5/5) 一 normcdf(19,20,1.5/5) 


P=0.6563 X0=18.0777 P1=0.9996 

从 己 和 己 可 以 看 出 ,与 一 个 零件 相 比 , (一 25 的 ) 样 本 均值 落 在 总 体 均值 附近 的 概 
率 要 大 得 多 . 
10.3.6 二 维 随 机 变量 的 概率 密度 、 协 方差 和 相关 系数 


实际 问题 中 随机 试验 的 结果 有 时 需要 用 两 个 随机 变量 来 描述 ,如 为 了 研究 儿童 的 发 
育 状 况 , 随 机 抽样 测量 儿童 的 身高 和 体重 ;在 众多 随机 因素 影响 下 炮弹 弹 着 点 的 横 坐 标 和 
纵 坐 标 . 二 维 连 续 随 机 变量 (X, Y) 的 概率 密度 用 p(x,y) 表 示 , 满 足 p(x,y) 之 0， 


| | pr ydrdy 一 1. (X,Y) 落 在 z,y 平面 上 某 区 域 人 4 内 的 概率 用 二 重 积分 


PLX,Y) EQ) = ||p Cr, drdy (25) 


计算 . 
由 (X,Y) 的 概率 密度 p(xz,y) 可 以 确定 两 个 随机 变量 X 和 Y 的 概率 密度 px (xz) 和 
py《y), 即 


px(z) 一 | pz)dys, pry(y) = | plzsy)dz. (26) 
而 随机 变量 大 和 YY 相互 独立 等 价 于 
plzr,y) 人 px x) py ly). (27) 


在 二 维 随机 变量 (X, Y) 的 数字 特征 中 ,X, Y 的 期 望 和 方差 仍 由 (8) 一 (10) 式 计算 ， 


10.3 随机 变量 的 概率 分 布 及 数字 特征 


而 描述 X， i 
(correlation coefficient) 定 义 如 下 , 


eb) 人 上 有 


=E[(X— EX)(Y— EY)] = EXY— (EX)(EY), (28) 
ry = oAXY) (29) 
VDX VDY 


相关 系数 > 度量 了 X, Y 的 相关 程度 , 当 X, Y 不 相关 时 r= 二 0( 即 cov( 久 ,了 ) = 二 0), 正 线性 
相关 时 r= 二 1, 负 线性 相关 时 r= 一 1. 

有 了 协 方差 的 概念 ,前 面 的 两 个 相互 独立 随机 变量 之 和 的 方差 的 公式 (12) 可 以 推 
广 为 


DaX 二 cy) = ceDX 二 ceDY 十 2ccscov(X,Y)， (30) 

二 维 正 态 分 布 是 最 常用 的 二 维 概率 分 布 ,其 概率 密度 为 

1 1 (zx—pa)’ 
p(x,y) De | rh of 

pn = 2 

27 EEA pea) | y £2) 作 (31) 
O02 O02 
按照 定义 算出 数字 特征 

EX =j, EY = jz， DX = 0, DY 一 cd， Re FE (32) 


可 以 看 出 ,对 于 二 维 正 态 随 机 变量 (X, 让 ,车头 与 Y 不 相关 Cr 二 0), 由 (31) 式 得 p(x,y) 王 
Px (Zz)py(y), 即 着 与 Y 独立 ， 

车 从 二 维 总 体 得 到 的 样本 数据 为 (zx;，y;) i 二 1,2,…,n, 样 本 均值 z,y 和 样本 均 方差 
ss 仍 用 (2) 式 和 (3) 式 计算 ,而 样本 协 方差 和 相关 系数 的 计算 公式 为 


此 


> ZX) (yi — y), r。 一 >， (33) 


Sr5y 


人 
= 二 


在 MATLAB 中 计算 样本 协 方 六 的 命令 
cov(xyy) ”% xy 是 样本 数据 ( 同 长 度数 组 )， 兴 出 协 方差 乱 血 [3 3 
计算 相关 系数 的 命令 


corrcoef(x,y) % x'y 同上 ， 洽 出 相关 系数 短 阵 [ | 
[xy 
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”kk/n 就 能 看 作 四 分 之 一 单位 圆 面积 x/4 的 近似 值 ,于 是 有 xsz4&/ 
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10.4 用 随机 模拟 计算 数值 积分 


随机 模拟 是 一 种 随机 试验 的 方法 ,也 称 为 蒙特 卡 罗 方 法 (Monte Carlo). 这 种 方法 利 
用 随机 试验 ,根据 频率 与 概率 、 平 均值 与 期 望 值 等 之 间 的 关系 ,推断 出 预期 的 结论 . 用 它 计 
算 定 积分 的 原理 可 以 从 下 面 的 直观 例子 得 出 . | ; 

图 10. 11 中 粗 线 是 四 分 之 一 单位 圆 , 如 果 向 图 中 边 长 为 1 的 
正方 形 里 随机 投 ” 块 小 石头 , 当 ? 很 大 时 小 石头 会 均匀 分 布 在 正 
方形 中 , 数 一 下 落 在 四 分 之 一 圆 里 的 小 石头 ,假定 有 个 ,那么 


n, 显 然 这 可 看 作 近 似 计算 x 的 一 种 方法 . 
可 以 用 概率 论 中 的 大 数 定律 来 说 明 这 个 直观 认识 的 原理 . 
大 数 定 律 ( 伯 努 利 (Bernoull) 定 理 ) 设 k 是 n 次 独立 重复 试 
验 中 事件 A 发 生 的 次 数 ,p 是 事件 A 在 每 次 试验 中 发 生 的 概率 , 则 对 任意 的 正 数 ,有 
limP{| 生 一 让 <e)=1. (34) 
若 规 定 “ 向 图 中 正方 形 随 机 投 一 块 小 石头 落 在 四 分 之 一 单位 圆 里 ”为 事件 A 发 生 , 则 
A 发 生 的 概率 p 应 该 等 于 四 分 之 一 单位 圆 面积 ,随机 投 ” 块 石 头 就 是 独立 重复 做 ” 次 试 
验 , 事 件 A 发 生 & 次 .由 (34) 式 ,n 无 限 变 大 时 上 /xn 与 p 之 差 小 于 任意 一 个 数 e 的 概率 趋 
于 1. . 
计算 数值 积分 是 随机 试验 方法 的 一 种 典型 的 应 用 . 


10.4.1 定 积分 的 计算 


通常 有 两 类 办 法 计算 定 积 

(1) 随机 投 点 法 | 

在 “投石 算 面积 ”的 例子 中 ,事件 A 在 每 次 试验 中 发 生 的 概率 p 是 四 分 之 一 单位 圆 面 
积 , 即 


0 we 


10.11 “投石 算 面 积 ” 


p = a 上’ a (35) 

n 次 试验 由 计算 机 完成 ,采用 [0,1] 区 间 上 的 均匀 分 布 产生 相互 独立 的 随机 数 . 记 这 样 产 

生 的 7 个 点 的 坐标 为 (zi，y) 《一 1，2，…，7)， 事件 A 发 生 等 价 于 (xz;,y;) 满 足 yi 三 

V1 一 xz， A 发 生 的 次 数 是 满足 y; 声 M1 一 xz (i 二 1,2,….n) 点 的 个 数 &. 由 伯 努 利 定理 ,p 
可 以 用 &/ 近似 蔡 代 . 

这 种 办 法 可 以 推广 如 下 . 对 任意 区 间 [a, 妇 内 的 连续 函数 f(x) ,满足 c 志 f(x) 志 de， 


10.4 用 随机 模拟 计算 数值 积分 


4 之 0) ,为 计算 定 积分 | rz)dz , 先 由 计算 机 产生 个 点 的 卒 标 (zi,yi) (i 二 1,2，…,n)， 


其 中 zi， yi 分 别 为 La, 5j 和 [ec, 4j 区 间 上 的 均匀 分 布 随 机 数 ,然后 记录 7 个 点 中 满足 
yi 全 了 《zi) 的 数目 , 则 


vb 
| rcodzm ld +6 a (36) 


(2) 均值 估计 法 
这 种 方法 依据 概率 论 的 以 下 两 个 定理 : a 
大 数 定律 ( 辛 钦定 理 ) 设 随机 变量 Y, ,YY ，…,Y, 相互 独立 ,服从 同一 个 分 布 , 且 具 
有 数学 期 望 五 习 王 Ap 一 1,2, 2), 则 对 任意 的 正 数 s, 有 


limP| 1DY -| <e)=1. (37) 


随机 变量 函数 的 期 望 ” 若 随机 变量 X 的 概率 分 布 密度 是 p(x) (az<<6), 则 随机 交 
量 的 区 数 了 = 了 (X) 的 期 望 为 


六 久 沪 二 | repacodz (38) 
于 是 , 当 X 为 [a, ] 区 间 均 匀 分 布 的 随机 变量 时 , p(x) =1/(6 一 a) (a<z<6) ,(38) 
式 给 出 
WE Sy (39) 
只 要 产生 [a, 5b] 区 间 相 互 独立 、 均 匀 分 布 的 随机 数 zx;(i 二 1,2,…,n) ,yi 二 f(zi) 就 相互 独 
立 . 根据 辛 钦定 理 , 当 7 很 大 时 期 望 EY==E(f(X)) 就 可 以 用 f(x;) 的 平均 值 近似 ,所 以 由 
(39) 式 得 到 


pb i 六 
| rcodzm 4 》\F(zi)， (40) 
六 i=] 


NS n 
与 随机 投 点 法 相 比 ,均值 估计 法 没有 c 和 f(z)d(c ,4d 之 0) 的 限制 ,只 需 计 算 f(x;)， 
不 需要 产生 随机 数 y;, 也 不 需要 作 y: 志 f(x) 的 比较 ,显然 大 为 方便 . 


10. 4.2 重 积分 的 计算 


用 随机 模拟 作 数值 积分 的 优点 不 仅 在 于 计算 简单 ,尤其 是 它 可 以 方便 地 推广 到 计算 

多 重 积分 ,而 不 少 多 重 积 分 是 其 他 方法 很 难 或 者 根本 无 法 计算 的 . 例如 可 以 用 均值 估计 法 
计算 如 下 的 二 重 积 

Jf crs ydrdy, Q: arb, cpgr) CyCg(r) Cd. (41) 


n 


设 zi,yi(i 王 1,2,…,n) 分 别 为 La, 6j 和 [c,dj] 区 间 上 的 均匀 分 布 随机 数 ,判断 每 个 点 (zi， 
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yi 是否 落 在 02 域内 ,将 落 在 2 域内 的 mm 个 点 记 作 (zi,yi) 《二 1,2,…,m)， 则 
Ndrdy ~ @—2 dO D>) fr,y). (42) 
注意 : (42) 式 的 分 母 是 n 而 不 是 . 
例 6 炮弹 射击 的 目标 为 一 椭圆 形 区 域 ,在 X 方向 半 轴 长 120m,Y 方 向 半 轴 长 80m. 
当 瞄 准 目标 的 中 心 发 射 炮弹 时 ,在 众多 随机 因素 的 影响 下 , 弹 着 点 服从 以 目标 中 心 为 均值 
的 正 态 分 布 , 设 和 方向 和 了 方向 的 均 方 差分 别 为 60m 和 40m, 且 关 方 向 和 Y 方 向 相互 独 
立 . 求 每 颗 炮 弹 落 在 椭圆 形 区 域内 的 概率 . 


2 
解 、 设 目标 中 心 为 <==0,y=0, 记 a 一 120, 5 一 80, 则 实 国 有 形 区 域 可 表示 为 2: 五 十 区 < 


记 正 态 分 布 的 概率 密度 pCz) 一- op( 一 部 ) ,2 让 exp( 一 其 ) ,其 中 


0 一 60,0, 二 40, 由 六 方向 和 De 于 是 炮弹 命中 椭圆 
形 区 域 的 概率 为 二 重 积 分 


全 三 epde = | se i 到 十 星 7) ] qzdy (43) 


这 个 积分 无 法 用 解析 方法 求解 ,下 面 借助 于 MATLAB 全 
10.4.3 MATLAB 实现 


用 随机 模拟 作 数 值 积分 主要 利用 均匀 分 布 产 生 的 随机 数 及 相应 的 判断 .计数 和 简单 
运算 . MATLAB 提供 的 命令 


unifrndCayby myny) 


产生 m 行 4 列 [a,5b] 区 间 上 的 均匀 分 布 随 机 数 . 当 < 二 0，0=1 时 ,可 用 randCmyn). 
例 7 用 蒙特 卡 罗 方 法 计算 x. 
解 (1) 随机 投 点 法 . MATLAB 程序 如 下 : 


”n= 10000; 
x= rand(2,n); 
k=0; 
for i=1:n 
if x(1:iD72 十 X(2:D"2<=1 
k 一 k 十 1; 
end 
end 
p=4*k/n 


10.4 用 随机 模拟 计算 数值 积分 


重复 计算 4 次 ,计算 结果 分 别 为 ; 
p=3.1244 p=3.1420 p=3.1780 p=3.1468 
当 提高 到 50000 时 ,重复 计算 4 次 ,计算 结果 为 : 


p=3.1372 p=3.1456 p=3.1442 p=3.1426 


解 (2) 均值 估计 法 .此 时 f(z)= V1 一 zx,MATLAB 程序 如 下 ;. 


n= 50000; 
x= rand(1,n); 
y=0; 
for i=1:n 
y=y+ sqrt(1~— x()°2); 
end 
p=4xy/n 


请 读者 计算 ,与 第 1 种 方法 比较 . 
例 6( 续 ) 由 (42) 式 ,以 及 椭圆 的 对 称 性 ,炮弹 命中 椭圆 形 区 域 的 概率 为 
P=4]fozpydrdy ~ Dfory) fry) = 二 exp[ 一 记 ( 所 + 加)]， 


2 2 
OF Oy 


其 中 O, 是 精 图 五 十 汶 二 1 在 第 1 象限 的 部 分 ,(z4,y,) 是 个 点 中 落 在 Q1 内 的 点 的 耸 标 ， 


4 一 1.2， 2 一 0. 8,c. 一 0， 6,c, 一 0.4( 均 以 100m 为 单位 ) ,而 随机 点 Ti 一 1 2 7) 分 
别 为 [0，a ] 和 [0, 5j 区 间 上 的 均匀 分 布 随 机 数 . 
MATLAB 程序 如 下 : 


a=1.2;b=0.8; 

sx=0.6;sy=0.4; 

n= 100000;m=0;z=0; 

x=unifrnd(0,1.2,1,n); 

y= unifrnd(0,0.8,1,n); 

for i=1:n 

if x(i)*2/a2+ y(1)°2/b*2<=1 
U=exp(—0.5x (x(i)°2/sx22+y(D)°2/sy2)); 
Z 一 zZ 十 Ui; 
m=m+1; 
end 
end 
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P=4xaxbxz/2/pi/sx/sy/n 
重复 计算 4 次 ,计算 结果 分 别 为 : 
P=0.8620 P=0.8667 P=0.8649 P=0.8676 


可 以 看 出 ,用 随机 模拟 方法 可 以 计算 被 积 函 数 非常 复杂 的 定 积分 . 重 积分 ,并 且 维 数 
没有 限制 ,但 是 它 的 缺点 是 计算 量 大 ,结果 具有 随机 性 ,精度 较 低 . 一 般 说 来 精度 为 zt 
阶 ,n 增加 时 精度 提高 较 慢 


10. 5 实例 的 建 模 和 求解 


10.5.1 报 童 的 利润 ( 续 ) 
模型 与 求解 ”按照 10. 1. 1 节 的 分 析 首 先 寻 求 每 天 报纸 需求 量 的 随机 规律 ,将 表 
10. 1 看 作 需 求 量 的 频率 ,由 此 可 以 计算 需求 量 的 均值 > 和 标准 差 o,. 虽然 报纸 的 需求 量 
是 离散 的 (r 王 0，1，2,…) ,但 由 于 -~ 较 大 ,可 以 将 它 看 作 连 续 随机 变量 zx, 又 根据 经 验 和 
常识 , 像 报纸 这 样 的 商品 的 需求 量 x 大 致 服从 正 态 分 布 (实验 11 将 介绍 正 态 分 布 的 检验 
方法 ). 于 是 (1) 式 给 出 的 报 童 每 天 的 平均 利润 V(n) 可 以 写作 
V(n) = jt Ux (a =p(r) dr + | (Banp lz)dz, (44) 


其 中 plz) 是 均值 标准 差 o, 的 正 态 分 布 的 概率 密度 . 
为 了 求 n 使 V(rw) 最 大 ,对 V(n) 求 导数 ,得 
V’(n) =(6— a)npln) -| e 一 Cc)DCz)dz 一 (9 一 C)7 力 (72) + (一 4) 访 ( 工 )dz 


=—| (a — cplr)dzr + (b—a)p(lzr) dr. 
令 导 数 等 于 零 , 得 到 
| pC)dz 
4 (45) 
l pix)dr “ “ 


WE n fn co 
当 均 信 7 比 标准 差 6 大 得 多 时 , | pz)dz ~ | _ plz)dz, 又 | Re 


| p(x)dzr ,(45) 式 可 化 为 


n 二 0 一 4 
| p(n)dr — $e. (46) 


容易 证 明 VI(n) 过 0, 所 以 当 p(x) 和 a,6,c 确定 后 ,由 (45) 式 或 (46) 式 得 到 的 确 是 每 天 平 


10.5 实例 的 建 模 和 求解 


均 利润 最 大 的 最 佳 购 进 量 n 

结果 分 析 ”在 一 般 的 条 件 5 宇 a 之 c 下 讨论 a ,b,c 的 变化 对 最 佳 决 策 的 影响 . 

从 (46) 式 看 出 , 当 56>a 二 c 时 , 即 购 进 价 与 退回 价 相 同 且 零售 价 高 于 购 进 价 , 报 童 不 
承担 任何 卖 不 出 去 的 风险 ,他 将 从 发 行商 处 购 进 尽 可 能 多 (无 穷 多 ) 的 报纸 . 这 样 必然 造成 
发 行商 的 损失 . 

当 6 二 a>c 时 , 即 零售 价 与 购 进 价 相同 且 高 于 退回 价 , 报 童 无 利润 可 得 ,他 不 从 发 行 
商 处 购 进 任 何 报纸 (mn 二 0). 这 样 发 行商 也 无 法 获得 任何 利益 . 

只 有 6>a>c 时 ,发 行商 和 报 童 才能 获得 利益 , 报 童 将 根据 需求 量 的 随机 规律 (用 
p《z) 描 述 ) 制 定 自己 的 应 对 策略 . 由 (46) 式 可 以 看 出 : 6 一 a 越 大 , 购 进 量 ” 越 大 ;0 一 c 越 
大 , 购 进 量 ” 越 小 . 这 些 都 符合 直观 的 理解 . 

MATLAB 实现 ”根据 表 10. 1 数据 和 a==0.8,6 二 1,c 二 0.75( 元 ) ,编写 MATLAB 程 
序 计算 : 

a=0.8;b=1;c=0.75; 

d= (b~a)/(b— 0o); 

r=[3 9 13 22 32 35 20 15 8 2]; 


rr= sum(r); 

x=110 :20:290; % 需求 量 取 表 10.1 中 小 区 间 的 中 点 

rbar= rx XVrr % 计算 均值 

Ss= sqrt(r x (x.°2)/rr— rbar’2) % 计算 标准 差 

n= norminv(q,rbar,s) % 按照 (46) 式 用 逆 概 率 分 布 计算 n 
结果 为 : | 


rbar =199.4340 s =38.7095 n =232.0127 
即 需求 量 的 均值 为 199 ,标准 差 为 38.7, 报 童 应 购 进 232 份 报 纸 . 
读者 可 以 考虑 当 需 求 量 服从 La ,ds -| 区 间 上 均匀 分 布 时 的 最 佳 决策 . 


10.5.2 路 灯 和 更换 策略 ( 续 ) 


模型 与 求解 ”按照 10.1.2 节 的 分 析 , 假 设 每 一 个 灯泡 的 更 换 价格 为 a, 包括 灯 泡 的 
成 本 和 安装 时 分 摊 到 每 个 灯泡 的 费用 ;管理 部 门 对 每 个 不 亮 灯泡 单位 时 间 (h) 的 罚款 为 
6b. 通过 调查 研究 ,并 根据 经 验 合理 地 假定 灯泡 寿命 服从 正 态 分 布 N(w,o), 记 概率 密度 函 
数 为 p(z) (zx 是 灯泡 寿命 ) 
记 更 换 周 期 为 工 ,灯泡 总 数 为 入 , 则 更 换 灯 泡 的 费用 为 Ka ,承受 的 罚款 为 
三 | CT 一 zz)dz， 


一 个 更 换 周期 内 的 总 费用 是 二 者 之 和 . 而 我 们 的 目标 函数 应 该 是 单位 时 间 内 的 平均 费 
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用 , 即 
Fk 
Ka 十 本 | (T— zx)p(r)dr 
A 一 区 : (47) 
为 得 到 最 佳 更 换 周期 ,求全 使 FCT) 最 小 . 令 和 5 一 0 可 得 
, a 了 - 


结果 分 析 第 一 ,从 (48) 式 可 以 看 出 ,a/b 越 大 , 即 灯泡 的 更 换 价格 与 惩罚 费用 之 比 
越 大 ,更 换 周 期 了 应 越 长 ,这 与 直观 认识 是 吻合 的 . 另外 ,车 管理 部 门 希望 以 灯泡 的 平均 
寿命 为 更 换 周 期 ( 即 了 一 /)， 来 制定 逢 惩罚 费用 , 则 由 (48) 式 可 得 
6 一 一 一 . (49) 
| zp lz)dz 
第 二 ,为 了 能 用 MATLAB 已 有 的 命令 计算 最 佳 更 换 周 期 , 需 对 (49) 式 作 以 下 变换 . 
以 NGCxso2) 的 概率 密度 (19) 式 代 人 (48) 式 左 端 作 积 
| Xp zr)dr | a) 


7 
ga exp 
2 2n0 20° 


T 2 2 
=p|__ pCz)dzr 一 下 exp(— 和 j= PD pT). 
A no 
(48) 式 化 为 
uF(T)— op(T) = a/b, (50) 
而 当 T 王 /时 ,(49) 式 化 为 
2 AZ 区 


MATLAB 实现 ” 设 某 品 牌 灯 泡 的 平均 寿命 为 4000h, 标准 差 为 100h, 即 寿命 服从 
N(4000 ,100: ) ,每 个 灯泡 的 安装 价格 为 80 元 ,管理 部 门 对 每 个 不 亮 的 灯泡 制定 的 惩罚 费 
用 为 0.02 元 /h. 

为 计算 最 佳 更 换 周期 ,注意 到 无 法 从 (50) 式 直接 解 出 了 ,我 们 采取 比较 (50) 式 左右 端 
的 大 小 ,调整 工 增加 或 减少 的 办 法 .用 MATLAB 编程 如 下 : 


a=80; b=0.02; aoverb=a/b 
mu 三 4000; s= 100; 


t= mu; % 设 定 T 的 初 值 、 
step=0.1; % 本 增加 或 减少 的 步 长 
var=0.01; %(50) 式 左右 端 比 较 的 误差 限 


vp= ‘mu x* normedf(t, mu, s) — s*2 * normpdf(t, mu,s); % 计算 (50) 式 左 端 
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if vp> aoverb % (50) 式 左 端 大 于 右 端 ,T 减少 
while (vp— aoverb)> var 
t= tt 一 Step; 
vp= mux normcdf(t, mu,s) 一 S"2 x normpdf(t,mu,s); 
end 
end 
if vp<<aoverb % 〈50) 式 右 端 大 于 左 端 ,T 增加 
while (aoverb— vp)> var 
t= t+ step; 
vp= mux normedf(t, mu, s)-s°2 x normpdf(t, mu, s); 
end 
end 
vp,t 
计算 结果 为 
aoverb =4000 vp =4.0000e+003 t=4.4589e+003 
最 佳 更 换 周 期 为 4459h. | 


改变 惩罚 费用 的 大 小 ,得 到 表 10. 11 的 结果 . 
表 10.1L 不 同 惩罚 费用 对 应 的 更 换 周 期 


0. 05 0. 1 0.5 | 1 | 10 


T | 3977 3918 3828 3797 3715 


可 以 看 出 , 随 着 惩罚 费用 的 增加 ,更 换 周 期 变 短 ， 

若 管理 部 门 希 望 以 灯泡 的 平均 寿命 为 更 换 周 期 ,由 《51) 式 计算 得 到 惩罚 费用 2= 
0. 04082. 

思考 ”如 果 在 目标 函数 (47) 式 中 ,考虑 更 换 时 没有 坏 的 灯泡 还 有 一 定 的 回收 价值 , 模 
型 和 算法 有 什么 变化 ( 见 10. 6 节 实 验 练习 第 9 题 )? 


10.6 实验 练习 


1. 掌握 概率 统计 的 基本 概念 及 用 MATLAB 实现 的 方法 ; 

2. 练习 用 这 些 方法 解决 实际 问题 . 

实验 内 容 

1. 设 总 体 X~N(40,5:), 抽 取 容 量 为 n 的 样本 ,样本 均值 记 作 x. 
(1) 设 4=36, 求 zx 在 38 与 43 之 间 的 概率 ; 

(2) 设 n=64, 求 与 总 体 均值 之 差 不 超 过 1 的 概率 ; 


ey 
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(3) 要 使 z 与 总 体 均 值 之 差 不 超过 1 的 概率 达到 0. 95,” 应 多 大 ; 
2. 某 厂 从 一 台 机 床 生产 的 滚珠 中 随机 抽取 20 个 , 测 得 直径 (mm) 如 下 : 
14.6,14.7,15.1,14.9,14.8,15.0,15.1,15.2,14.8,14.3, 
15.1, 14.2, 14.4, 14.0, 14.6, 15.1, 14.9, 14.7, 14.5, 14.7 
试 给 出 这 些 数 据 的 均值 .标准 差 方差. 极 差 ,并 画 出 直方 图 . 
3. 某 校 60 名 学 生 的 一 次 考试 成 绩 如 下 : 
93 75 .83 93 91°85 84 82 77 76 77 95 94 89 91 
88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 
75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 
76 90 89 71 66 86 73 80 94 79 78 77 63 53 55 
作 直 方 图 ,计算 均值 ,标准 差 , 极 差 \ 偏 度 、 峰 度 . 
4. 用 茜 全 目光 丰 放下 种 作 下 国生 本 给 定 区 间 上 的 积分 ,并 改变 随机 点 数目 观察 对 结 
果 的 影响 . 


(1) ?一 寺 1T,0s<zsli 


(2) y 一 esin 2z,0 委 雪 2; 

(3) y= VI+7z ,0<r<2; 

Ce 2<7<2. 

5, 与 例 6 类似 ,但 炮弹 射击 的 目标 为 一 半径 100m 的 圆 形 区 域 , 弹 着 点 以 圆心 为 中 心 
旺 二 维 正 态 分 布 , 设 在 密度 函数 (31) 式 中 6o,= 二 80m 和 o, 二 50m, 相 关系 数 r==0. 4. 求 炮弹 
命中 贺 形 区 域 的 概率 . 

6， 冰淇淋 的 下 部 为 锥 体 , 上 部 为 半球 . 设 它 由 锥 面 z= Vr 十 和 球面 x? 十 y? 十 
(z 一 1)* 王 1 围 成 ,用 蒙特 卡 罗 方 法 计算 它 的 体积 

7. 对 于 报 童 问题 , 如 果 报 纸 的 需求 量 服 从 正 态 分 布 NC(y,o?), 且 批发 价 为 a= 


A Ki 其 中 ?为 购 进 报纸 的 数量 ,天 为 一 个 给 定 的 常数 , 建立 报 童 为 获得 最 大 利润 的 


数学 模型 . 当 已 知 kw 一 2000,， o==50,A 二 0. 5;K 一 50000,6==0.5,c 二 0, 35 时 ,为 了 获得 最 
大 的 利润 ,求解 报 童 每 天 购 进 的 报纸 数量 x. 

8. 在 路 灯 更 换 问 题 中 ,考虑 没有 坏 的 灯泡 还 有 一 定 的 回收 价值 (常数 ) ,建立 相应 
数学 模型 并 求 出 更 换 周期 的 表达 式 . 当 已 知 某 品 牌 灯 泡 的 平均 寿命 为 4000h， 
N(4000,100:) ,每 个 灯泡 的 安装 价格 为 70 元 ,管理 部 门 对 每 个 不 亮 的 灯泡 制定 的 惩罚 费 
用 为 0.02 元 /h, 每 个 未 坏 灯 泡 的 回收 价格 为 5 元 ,计算 最 佳 更 换 周 期 . 

9. 轧钢 有 两 道 工序 : 粗 轧 和 精 轧 . 粗 轧 钢坯 时 由 于 各 种 随机 因素 的 影响 ,得 到 的 钢 
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材 的 长 度 呈正 态 分 布 ,其 均值 可 由 轧机 调整 ,而 方差 是 设备 精度 决定 的 ,不 能 改变 ; 精 轧 时 
将 粗 轧 得 到 的 钢材 轧 成 规定 的 长 度 ( 可 以 认为 没有 误差 ). 如 果 粗 轧 后 的 钢材 长 度 大 于 规 
定 长 度 , 精 轧 时 要 把 多 出 的 部 分 轧 掉 , 造 成 浪费 ;如 果 粗 轧 后 的 钢材 长 度 已 经 小 于 规定 长 
度 , 则 整 根 报废 ,浪费 更 大 . 问题 是 已 知 钢材 规定 的 长 度 ! 和 粗 轧 后 的 钢材 长 度 的 均 方差 
o, 求 可 以 调整 的 粗 轧 时 钢材 长 度 的 均值 m, 使 总 的 浪费 最 小 . 试 从 以 下 两 种 目标 函数 中 先 
择 一 个 ,在 (一 2m,o 一 20cm 条 件 下 求 均值 m， 

(1) 每 粗 轧 一 根 钢材 的 浪费 最 小 ; , 

(2) 每 得 到 一 根 规定 长 度 钢材 的 浪费 最 小 . 
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统计 推断 


统计 推断 的 目的 是 通过 对 样本 的 处 理 和 分 析 , 得 出 与 总 体 参数 相关 的 结论 . 统计 推断 
包括 参数 估计 和 假设 检验 两 部 分 内 容 .事实 上 ,我 们 每 天 接触 的 新 闻 报 道 就 经 常 涉 及 到 统 
计 推 断 间 题 . 

报道 1: 从 20 世纪 80 年 代 以 来 ,中 国 7 至 17 岁 青 少年 男女 平均 身高 分 别 增长 了 
6. 9cm 和 5. 5cm, 体 重 分 别 增长 了 6. 6kg 和 4. 5kg. 有 关 专 家 称 ,这 显示 出 中 国 青少年 的 
体格 发 育 呈 显著 增长 趋势 ，…… 儿 童 .青少年 的 生长 长 期 趋势 ,已 经 超过 了 发 达 国 家 第 二 
次 世界 大 战 后 出 现 的 生长 加 速水 平 ( 中 新 社 北京 2002 年 12 月 10 日 报道 ). 

报道 中 关于 青少年 平均 身高 和 体重 的 数据 是 怎么 得 到 的 呢 ? 不 会 是 对 全 国 青少年 普 
查 的 结果 ,只 能 是 抽样 得 到 的 数据 (样本 ) ,但 报道 中 的 结论 却 是 对 全 国 而 言 ( 总 体 ) ,应 该 
怎样 评价 这 种 从 样本 推断 总 体 的 结论 的 可 信 程 度 ? 

报道 2: 日 本 厚生 劳动 省 的 一 个 研究 小 组 经 过 多 年 大 规模 跟踪 调查 ,证明 吸 烟 是 造成 
死亡 率 升 高 的 最 大 日 常 性 因素 . 这 个 研究 小 组 从 1980 年 开始 对 1 万 名 30 岁 以 上 健康 男 
女 进 行 了 为 期 19 年 的 跟踪 调查 ,分 析 了 血压 .有 盟 固 醇 值 .血糖 值 . 肥 胖 度 .吸烟 习惯 饮酒 
习惯 等 与 死亡 率 的 关系 . 

结果 发 现 , 年 龄 和 其 他 状况 相近 的 男性 每 天 吸烟 1 包 , 死 亡 率 比 不 吸烟 的 人 高 
34. 6%%; 每 天 饮酒 的 男性 比 不 饮酒 者 死亡 率 高 1.7%% ,女性 高 4.1%; 血 压 、 血 糖 信 在 正常 
值 之 上 每 升 高 1 个 单位 ,死亡 率 分 别 上 升 0. 5% 至 0.8% 和 0. 3%; 高 胆固醇 和 肥胖 虽然 
会 造成 动脉 硬化 等 而 导致 死亡 率 上 升 ,但 对 死亡 率 总 体 影响 却 不 大 ,而 每 天 吸 1 包 烟 的 
人 ,死亡 的 风险 比 血压 高 出 正常 值 40 单位 以 上 、 血 糖 值 高 出 正常 值 100 单位 以 上 的 人 还 
要 高 (广州 日 报 2003 年 8 月 5 日 报道 ). 

报道 明确 地 说 是 抽样 调查 ,并 给 出 了 样本 容量 ， 那么 是 怎样 由 样本 推断 出 关于 总 体 的 
结论 的 呢 ? 

报道 3; 从 2000 年 7 月 1 日 开始 ,北京 .上 海 、. 广 州 三 大 城市 率先 实施 《车 用 无 铅 汽 
油 》 的 环保 标准 :日 前 国家 质量 技术 监督 局 在 这 三 市 进行 了 新 汽油 标准 实施 后 的 第 一 次 国 
家 监督 抽查 . 这 次 共 抽 查 了 三 市 的 32 家 加 油 站 的 车 用 汽油 产品 ,抽样 合格 率 为 75% ,其 
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中 90 号 无 铅 车 用 汽油 抽查 了 15 批 次 ,合格 10 批 次 ,93 号 车 用 无 铅 汽油 抽查 了 17 批 次 ， 
合格 14 批 次 .…… 本 次 抽查 中 硫 含量 全 部 合格 ,但 3 个 城市 存在 差别 ,上 海 的 硫 含量 最 
低 ,其 次 是 北京 .广州 ,但 与 国际 上 的 要 求 相 比 , 仍 有 较 大 差距 . 本 次 抽查 发 现 的 主要 问题 
是 烯烃 含量 超标 ,新 标准 规定 ,烯烃 含量 不 大 于 35% ,不 合格 的 样品 中 有 5 个 批 次 产品 的 
烯烃 含量 都 大 于 40% ,而 且 主 要 出 在 90 号 汽油 上 (中 央 电视 台 2001 年 2 月 27 日 报道 ). 

报道 中 提 到 了 抽样 合格 率 , 但 样本 容量 很 小 ,能 够 得 到 关于 总 体 情况 的 可 靠 的 结 
论 吗 ? 

通过 这 个 实验 你 将 了 解 并 学 会 怎样 由 样本 数据 估计 总 体 的 一 些 参 数 ,估计 的 可 靠 程 
度 如 何 ,以 及 怎样 根据 样本 数据 去 肯定 或 否定 一 个 事先 提出 的 假设 . 以 下 11. 1 节 提出 几 
个 经 过 简化 的 问题 ,11. 2 节 介绍 参数 估计 的 概念 及 其 MATLAB 实现 ,11. 3 节 介绍 假设 
检验 的 理论 和 方法 及 其 MATLAB 实现 ,11. 4 节 求 解 11.1 节 的 问题 并 分 析 计 算 结 果 
11. 5 节 布 置 实验 练习 . 


11.1 实例 及 其 分 析 


结合 上 面 的 3 个 报道 ,本 节 通 过 收集 到 的 部 分 数据 提出 统计 推断 中 的 参数 估计 和 假 
设 检验 问题 ,并 作 初 步 分 析 . 


11.1.1 学 生 身 高 的 变化 


问题 ”中 国 近 20 多 年 的 经 济 发 展 使 得 人 民 的 生活 得 到 了 很 大 的 提高 ,不 少 家 长 都 觉 
得 孩子 这 一 代 的 身高 比 上 一 代 有 了 很 大 变化 .下 面 是 近期 在 一 个 经 济 发 展 比较 快 的 城市 
中 学 和 一 个 农村 中 学 收集 到 的 17 岁 龄 的 学 生 身 高 数据 : ， 

50 名 17 岁 城市 男性 学 生 身 高 (单位 : cm): 

170. 1 179.0 171.5 173.1 174.1 177.2 170.3 176.2 163.7 175.4 

163. 3 179.0 176.5 178.4 165.1 179.4 176.3 179.0 173.9 173.7 

173.2 172.3 169.3 172.8 176.4 163.7 177.0 165.9 166.6 167.4 

”174.0 174.3 184.5 171.9 181.4 164.6 176.4 172.4 180.3 160.5 

166.2 173.5 171.7 167.9 168.7 175.6 179.6 171.6 168.1 172.2 

从 100 名 同龄 农村 男性 学 生 的 身高 (原始 数据 从 略 ), 计 算出 样本 均值 和 标准 差分 别 
为 168. 9cm 和 5. 4cm. 

(1) 怎样 对 目前 17 岁 城市 男性 学 生 的 平均 身高 做 出 估计 ? 

(2) 又 查 到 20 年 前 同一 所 学 校 同龄 男生 的 平均 身高 为 168cm ,根据 上 面 的 数据 加 
答 ,20 年 来 17 岁 城 市 男性 学 生 的 身高 是 否 发 生 了 变化 ? 

《3) 由 收集 的 城市 和 农村 中 学 的 数据 回答 ,两 地 区 同龄 男生 的 身高 是 否 有 差距 ? 


| 
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分 析 ”对 于 问题 (1) ,一 个 明显 的 、 人 们 都 能 接受 的 结论 是 ,用 50 名 17 岁 城市 男性 学 
生 的 平均 身高 (样本 均值 ) 作 为 17 岁 城市 男性 学 生 的 平均 身高 (总 体 均值 ) 的 估计 值 ,大 家 
也 知道 这 个 估计 不 可 能 完全 可 靠 .需要 进一步 解决 的 问题 是 ,学 生 的 平均 身高 会 在 多 大 的 
范围 内 变化 ,其 可 靠 程度 如 何 . 

对 于 问题 (2) ,不 妨 先 假定 学 生 的 身高 没有 变化 , 即 假设 目前 仍 为 168cm, 再 根据 50 
名 学 生 身 高 数据 检验 这 个 假设 的 正确 性 . 显然 ,样本 均值 一 般 不 会 刚好 等 于 168cm, 但 若 
样本 均值 只 比 168cm 高 一 点 ,人 们 将 不 认为 总 体 均 值 发 生 了 变化 , 即 承认 原来 的 假设 . 需 
要 解决 的 问题 是 ,样本 均值 比 168cm 高 多 少 , 才 有 理由 否认 原来 的 假设 . 

问题 (3) 类 似 于 问题 (2) ,要 通过 样本 数据 检验 的 假设 是 ,两 地 区 同龄 男生 的 平均 身高 
没有 差距 .需要 解决 的 问题 是 ,两 个 样本 均值 相差 多 少 , 才 有 理由 否认 这 个 假设 . 

我 们 将 在 11. 5 节 继 续 讨论 这 个 问题 . 


11.1.2 了 豚 烟 对 血压 的 影响 


问题 “为 了 研究 吸烟 对 血压 的 影响 ,对 吸烟 和 不 吸烟 两 组 人 群 进行 24h 动态 监测 , 吸 
烟 组 66 人 ,不 吸烟 组 62 人 ,分 别 测量 24h 收缩 压 (24hSBP) 和 舒张 压 (24hDBP) , 白天 
(6Am-10Pm) 收 缩 压 (dSBP) 和 舒张 压 (dDBP ), 夜间 (10Pm~6Am) 收 缩 压 (nSBP) 和 和 舒 
张 压 CnDBP). 然后 分 别 计算 每 类 的 样本 均值 和 标准 差 ,如 表 11.1 所 示 . 


表 11.1 了 豚 烟 和 不 豚 烟 组 血压 的 样本 均值 与 标准 差 单位 : mmHg 


吸烟 组 均值 吸烟 组 标准 差 不 吸烟 组 均值 不 吸烟 组 标准 差 
` 24hSBP 119. 35 10.77 114. 79 8.28 | 
24hDBP 76. 83 8. 45 72. 87 6.20 
dSBP 122.70 11. 36 117. 60 8.71 
dDBP 79. 52 8.75 75.44 6. 80 
nSBP 109. 95 10.78 107. 10 10.11 
nDBP 69. 35 8. 60 65. 84 7.03 


吸烟 对 血压 是 否 有 影响 ? 从 这 些 数 据 中 能 得 到 什么 样 的 推断 ? 
分 析 ”吸烟 和 不 吸烟 两 组 人 群 分 别 来 自 两 个 非常 大 的 总 体 , 这 个 问题 需要 从 两 个 样 
本 的 参数 (均值 与 标准 差 ) 推 断 总 体 参数 的 性 质 (这 里 是 两 个 总 体 的 均值 是 否 相等 ). 


11.1.3 汽油 供 货 合 后 


问题 根据 国家 制定 的 标准 ,加 油 站 加 大 了 成 品 油 的 进货 监控 . 某 炼油 厂 ( 申 方 ) 向 加 


@ 数据 来 源 : 中 华 心血 管 病 杂 志 1998 年 第 26 卷 第 5 期 (高 血压 研究 专栏 》 
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油 站 (乙方 ) 成 批 ( 车 次 ) 供 货 , 双 方 制定 了 相关 的 产品 质量 监控 合同 ,如 加 油 站 考虑 硫 含量 
一 项 指标 时 ,要 求 含 硫 量 不 超过 0.08%. 若 双 方 商定 每 批 抽 检 10 辆 车 , 试 以 下 面 数据 为 
例 讨论 乙方 是 否 应 接受 该 批 汽 油 . 

0 个 含 硫 量 数据 (办 ): 

0.0864 0.0744 0.0864 0.0752 0. 0760 0. 0954 0. 0936 0. 1016 0.0800 0. 0880 

(1) 只 根据 这 些 数据 推断 乙方 是 否 应 接受 该 批 汽油 ;如 果 甲 方 是 可 靠 的 供 货 商 , 并 且 
对 产品 的 稳定 性 提供 了 进一步 的 信息 ,乙方 对 应 的 策略 有 什么 变化 ? 

(2) 现 乙 方 与 一 新 炼油 厂 ( 丙 方 ) 谈 判 , 并 且 风 闻 丙 方 有 用 含 硫 量 0. 086% 的 汽油 顶 
蔡 合 格 品 的 前 科 ,那么 如 果 乙 方 沿用 与 甲 方 订 的 合同 ， 会 有 什么 后 果 . 

分 析 ”容量 为 10 的 样本 是 小 样本 ,随机 误差 较 大 . 若 乙 方 认 为 甲 方 一 向 可 靠 , 应 相信 
它 提供 的 信息 ,尽量 接受 它 的 供 货 . 而 对 尚 不 能 寄 了 予 信赖 的 丙 方 , 则 必须 尽量 杜绝 其 以 次 
充 好 的 手段 得 过 , 这 个 问题 涉及 统计 推断 中 的 两 类 错误 : 弃 真 和 取 伪 . 由 于 样本 数据 的 随 
机 性 ,这 两 类 错误 是 不 可 避免 的 ,问题 在 于 怎样 从 实际 出 发 ,在 二 者 之 间 做 出 恰当 的 折 中 . 


” 我们 将 在 11. 5 节 继 续 讨论 这 个 问题 . 
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在 统计 中 参数 估计 一 般 指 的 是 ,假定 总 体 的 概率 分 布 的 类 型 (如 正太 分布、 指数 分 
布 ) 已 知 ,由 样本 估计 分 布 的 参数 (如 正 态 分 布 的 和 ,指数 分 布 的 A), 我 们 知道 ,实际 中 
最 有 用 的 数字 特征 一 一 期 望 和 方差 与 分 布 的 参数 之 间 有 确定 的 关系 ,本 节 只 讨论 总 体 其 
望 和 方差 的 估计 ,并 且 由 于 实际 中 最 常见 的 分 布 是 正 态 分 布 ,理论 上 也 只 有 在 总 体 正 态 分 
布 的 前 提 下 ,才能 得 到 方便 适用 的 结果 ,所 以 在 这 个 实验 中 ,如 不 特别 说 明 , 都 假定 总 体 
服从 正 态 分 布 


11.2.1 点 估计 
”点 估计 是 在 总 体 分 布 已 知 的 前 提 下 ,用 样本 统计 量 确 定 总 体 参数 的 一 个 数值 ,估计 的 


方法 有 和 矩 法 、 极 大 似 然 法 等 . 
样本 (zi ,zx;，… ,Zz,) 的 一 阶 矩 就 是 它 的 均值 , 即 
z= i (1) 
二 阶 中 心 箱 定 义 为 ， 
入 : 兰 Pz. 本 


可 以 用 z 和 A 对 总 体 均值 y 和 方差 o: 作 点 估计 , 记 作 /一 zc 一 A: 这 种 方法 称 为 矩 估 
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计 法 ,是 本 实验 用 的 方法 . 
极 大 似 然 估 计 法 的 基本 思想 是 ,对 于 给 定 的 样本 (zi ,zs，… ,ZX,) 和 总 体 的 概率 密度 函 
数 plzx,0) , 待 估计 的 参数 9 应 使 得 (zi ,zs，… ,zx,) 出 现 的 概率 , 即 概率 密度 函数 的 乘积 


L(xi To ,Tn ;0) ] axis0) 达到 最 大 , 即 求 0 使 得 
i=] 
L(0) = maxL (x ,za 0) 一 max] | plzi;0). (3) 
. i=} 


11.2.2 点 估计 的 评价 标准 

根据 同一 样本 用 撼 估 计 和 极 大 似 然 估 计 可 能 对 一 个 总 体 参 数 给 出 不 同 的 点 估计 ,如 
何 评价 其 优 劣 呢 ? 当然 要 看 它 “ 接 近 ” 所 估计 的 总 体 参数 的 程度 ,而 对 “接近 ” 则 有 几 种 常 
用 的 评价 标准 . 

(1) 无 偏 性 

待 佑 的 总 体 参数 记 作 9, 从 样本 zi ,zs，… ,zx, 得 到 的 0 的 一 个 估计 量 记 作 0 ,由 于 样本 
的 随机 性 ,0 也 是 随机 的 ,如 果 0 的 期 望 20=0, 则 称 9 是 9 的 无 偏 估计 量 . 


对 于 正 态 总 体 NG;,o) ,由 (1) 式 容易 计算 Ex = 1 DEr, 一 三 jy ,所 以 样本 均值 
Zz 是 4 的 无 偏 估计 .二 阶 中 心 矩 是 否 为 o? 的 无 偏 估计 呢 ? 需要 计算 一 下 : 由 (2) 式 


FEA, =E (2 Cra)’)=— 二 (> Ex —nE zx’) 
i i= 


= 二 [nce +t) "(© rx) |= 2 


n 


可 见 二 阶 中 心 矩 不 是 2 的 无 偏 估计 ,但 是 显然 有 (As | 二 0 ,而 一 A 正 是 样本 方 


差 站 一 -二 > (Cz; 一 z)*， 所 以 用 作为 的 估计 , 即 产 一, 它 是 无 偏 的 . 


如 果 当 样本 容量 n 趋 于 无 穷 大 时 ,E6 趋 于 0, 则 称 是 0 的 渐 近 无 偏 估计 量 . 显然 ,对 
于 于, 二 阶 中 心 矩 As 是 渐 近 无 偏 的 . 

无 偏 是 一 个 平均 性 的 标准 ,只 有 当 进 行 多 次 估计 时 才能 说 它 平 均 起 来 “接近 ”总 体 参 
数 ,所 以 无 偏 性 对 于 只 作 一 两 次 估计 的 问题 是 没有 多 大 实际 意义 的 . 

(2) 有 效 性 

6 作为 9 的 估计 量 ,自然 希望 它 的 方差 D9 一 E(60 一 90)? 越 小 越 好 . 设 0 ,6. 是 从 一 个 样 
本 得 到 的 9 的 两 个 无 偏 估计 量 ,如 果 D6, 志 D6,, 则 称 61 比 6, 有 效 . 如 果 对 固定 的 n, 某 个 
6 使 D6 达到 最 小 , 则 称 6 为 9 的 有 效 估计 量 . 

根据 一 个 样本 zi ,zz，… ;Zz, ,你 可 以 用 所 有 7 个 数据 的 平均 值 z 作 为 总 体 均值 4 的 佑 
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计 , 也 可 以 只 用 其 中 个 (过 n) 的 平均 值 z“* 作 为 4 的 估计 ,它们 都 是 无 偏 的 ,容易 推出 
Dz<Dze% ,所 以 + 比 x* 更 有 效 . 

(3) 一 致 性 

由 容量 为 的 样本 得 到 的 估计 量 记 作 6, ,自然 希望 > 越 大 估计 越 准 ,如 果 对 任 给 的 
E>0 满足 

limP{| 0,—0|<=e)=1, 

则 称 6, 依 概 率 收敛 于 90, 这 样 的 6 称 为 6 的 一 致 估计 量 . 

可 以 证 明 , 不 论 随机 变量 和 总 体 分 布 如 何 , 样 本 均值 z 和 方差 ;* 都 是 yy 和 o? 的 一 臻 
无 偏 估 计 , 所 以 总 体 均 值 和 方差 (及 标准 差 ) 的 点 估计 通常 取 


1 一 工 0 Sy (4) 


11.2.3 ”总 体 均值 的 区 间 估计 


对 于 11. 1. 1 和 节 学 生 的 身高 ,从 50 名 学 生 的 数据 可 以 算出 z= 二 172. 7cm 和 xs 一 
5.37cm, 如 上 所 述 ,我 们 有 理由 用 这 两 个 数 估 计 总 体 的 均值 和 标准 差 , 但 是 由 于 学 生 选 取 
的 随机 性 ,再 测量 若干 人 的 身高 ,样本 平均 值 和 标准 差 可 能 就 不 是 上 面 的 两 个 数 了 . 那么， 
总 体 的 均值 和 标准 差 到 底 是 多 少 ? 对 于 这 种 不 确定 性 ,一 种 有 说 服 力 的 解决 办 法 是 : 待 
估 参 数 如 总 体 的 均值 和 方差 是 客观 存在 的 ,样本 的 随机 性 造成 点 估计 在 变化 , 待 估 参数 应 
该 就 在 点 估计 的 附近 . 于 是 可 以 给 出 待 估 参 数 的 一 个 区 间 . 

一 般 地 ,对 于 总 体 的 待 佑 参数 0( 如 ,0 ) ,希望 通过 样本 ri,zz，…zn 的 计算 给 出 一 
个 区 间 [2 ,6 了], 使 以 较 大 的 概率 落 在 这 个 区 间 内 . 若 

P(0, <IKH)=1—a, 0<a 志 1， (5) 
则 [9 ,0 ] 称 为 6 的 置信 区 间 ,0 ,0 分 别称 为 置信 下 限 和 置信 上 限 ,1 一 a 称 为 置信 概率 或 
置信 水 平 ,a 称 为 显著 性 水 平 ,一 般 a 取 一 个 很 小 的 数 ,如 0. 05 或 0. 01. 

置信 区 间 [6, ,0 的 大 小 给 出 了 估计 的 精度 ,置信 水 平 1 一 a 给 出 了 估计 的 可 信 程度 . 
可 信 程度 可 以 这 样 理解 : 随机 选 一 个 容量 为 n 的 样本 ,得 到 一 个 置信 区 间 [9, ,0,] ,这样 的 
区 间 是 否 包 含 9? 设 4 二 0.05 ,置信 水 平 是 0.95, 可 以 粗略 地 理解 为 : 重复 取 100 个 容量 
为 n 的 样本 ,得 到 的 100 个 置信 区 间 中 约 有 95 个 包含 了 0. 而 实际 上 我 们 只 取 1 个 样本 ， 
得 到 1 个 置信 区 间 并 断言 它 包 含 了 0, 这样 做 当然 可 能 犯错 误 ,但 是 犯错 误 的 概率 只 有 
0. 05. 

给 出 了 置信 区 间 [b ,90, J 和 置信 水 平 1 一 a 的 估计 , 称 为 6 的 区 间 估 计 . 置信 区 间 越 小 ， 
估计 的 精度 越 高 ;置信 水 平 越 大 ( 即 a 越 小 ) ,估计 的 可 信 程度 越 高 . 但 是 这 两 个 指标 显然 
是 矛盾 的 ,通常 的 做 法 是 在 一 定 的 置信 水 平 下 选取 尽量 小 的 置信 区 间 . 

下 面 在 正 态 总 体 Nu:c) 的 假定 下 ,分 总 体 方 差 已 知 和 未 知 两 种 情况 讨论 总 体 均 值 
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(1) 总 体 方差 于 已 知 
区 闻 估 计 的 基本 思想 是 用 样本 构造 一 个 其 分 布 为 已 知 的 统计 量 . 根据 实验 10 的 结果 
Ez 二 jy,Dz=g/n, 及 zx~N(y;《o/Yn)’), 对 Zz 标准 化 得 到 NC0,1), 即 
z= EK ~ NO0,1). (6) 


o n 
给 定 置信 水 平 1 一 c, 寻 找 ,ze 使 [ws 一-&<we | =1 一 a. 由 和 N(0,1) 的 对 称 
o/Vn 
性 ,> 的 对 称 区 间 长 度 最 小 ,所 以 zz 取 N(0,1) 的 1 一 a/2 分 位 数 -oz29U1 二 一 wz ,满足 


P| —u_ z= Lu | 二 1 一 ga, 如 图 11. 二 对 之 的 不 等 式 作 变换 , 即 得 


ni 
Pz wun E SuSE | 一 1 一 wa. (7) 
于 是 在 置信 水 平 1 a 下 ,的 置信 区 间 为 [一 -ws 生 ， z+w-n 算 ]. 


(2) 总 体 方差 oz 未 知 
这 种 情况 下 只 好 用 样本 方差 * 代替 吐 , 但 是 二 下 不 再 服从 N(0,1). 根据 实验 10 中 


s/Vn 
的 妇 分 布 和 + 分 布 的 定义 ,可 以 证 明 
Eh ~ nl), (8) 
Re (9) 
SVM 


”由 于 :分布 也 是 对 称 的 , 且 图 形 与 N(0,1) 相 似 ( 见 图 11. 2) ,所 以 可 以 用 xz 一 1) 的 1 一 o/2 


分 位 数 刀 -sz 代 蔡 (7) 式 的 w1-。s ,有 


P{z— 4 志气 4 扩 工人 | pe 1l—a. (10) 


二 
下 
即 在 置信 水 平 1 a 下 ,的 置信 区 间 为 | 一 4-wn 庄 ， 二 + 二 | 


从 总 体 均值 y 的 区 间 估 计 的 结果 (7) 式 和 (10) 式 看 出 ,对 于 一 定 的 a,o 或 * 越 大 , 置 
信 区 间 长 度 越 大 , 即 估计 的 精度 越 低 ; 样 本 容量 nn 越 大 ,置信 区 间 越 短 , 即 估计 的 精度 越 
高 . 这 显然 是 合理 的 . 


11.2 参数 估计 


1 1 -一 上 1 
-Uw2 Ul 一 1-o2 0 ll 


图 11.1 置信 水 平 1 一 zx 下 NN(0,1) 的 分 位 点 图 11,2 置信 水 平 1 一 x 下 t 分 布 的 分 位 点 


11.2.4 总 体 方差 的 区 间 倍 计 


根据 (8) 式 用 样本 方差 5 对 总 体 方差 做 区 间 估 计 . 由 于 x? 分 布 不 对 称 ,给 定 置信 
水 平 1 一 a, 严 格 地 寻求 长 度 最 短 的 置信 区 间 是 困难 的 . 统计 上 ,为 了 简单 起 见 , 仍 然 仿照 
均值 区 间 估 计 的 方法 ,选取 x? 分 布 的 o/2 分 位 数 x ,和 1 一 a/2 分 位 数 xi_,,( 见 


图 11. 3) ,满足 


| ene ES 
0 en Xeon 


图 11.3 置信 水 平 1 一 wx 下 Xx? 分 布 的 分 位 点 


2 (nC— 1)s 2 ee 
Pp{x’, < og I 二 x ) 二 1 Q. (11) 
它 等 价 于 
加 1 
| et eo ee 212) 
区 2 Xa | 


(n—1)s Cn—1)s 
2 ’ 2 


即 在 置信 水 平 1 一 a 下 ,o? 的 置信 区 间 为 | 


| 
Xi1-a2 Xa 


:或 者 o 的 置信 区 间 


1—a/2 Xas2 


2 
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11.2.5 参数 估计 的 MATLAB 实现 


MATLAB 统计 工具 箱 中 ,有 专门 计算 总 体 均 值 .标准 差 的 点 估计 和 区 间 估 计 的 程 
序 . 对 于 正 态 总 体 ,命令 是 

[mu sigma muci sigmaci] = normfit(x,alpha) “ 

其 中 x 是 样本 (数组 ) ,alpha 是 显著 性 水 平 a(alpha 缺 省 时 设 定 为 0.05) ,输出 mu 和 
sigma 是 总 体 均值 和 标准 差 o 的 点 估计 , muci 和 sigmaci 是 总 体 均 值 y 和 标准 差 o 的 区 
闻 估 计 . 当 x 是 矩阵 ( 列 为 变量 ) 时 输出 行 向 量 . . 

对 于 11.1.1 节 学 生 的 身高 ,用 normifit 可 得 总 体 均值 x 和 标准 差 e 的 点 估计 和 区 间 
估计 如 表 11. 2(c 一 0.05) | 

表 11.2 学 生 的 身高 均值 和 标准 差 的 点 估计 和 区 间 估 计 


身高 /cm 
均值 点 估计 172. 7040 
均值 区 间 估 计 3» (171. 1777, 174. 2303) 
标准 差点 估计 5. 3707 
标准 差 区 间 估 计 (4. 4863,6. 6926) 
需要 说 明 , 上 面 的 区 间 估 计 是 在 正 态 总 体 的 假定 下 辣 出 的 ,如 果 无 法 保证 这 个 假定 成 


因为 根据 概率 论 的 中 心 极限 定理 ,只 要 样本 足够 大 (实用 中 可 取 ”之 50) 均 值 就 近似 地 服 
从 正 态 分 布 ;二 是 MATLAB 统计 工具 箱 中 提供 了 一 些 具有 特定 分 布 总 体 的 区 间 估 计 的 
命令 ,如 expfit ,poissfit, gamfit, 分 别 用 于 指数 分 布 . 泊 松 分 布 和 工分 布 的 区 间 估 计 , 具 体 
用 法 参见 MATLAB 帮助 系统 . 


11.3 假设 检验 


假设 检验 是 另 一 类 统计 推断 问题 . 11. 1. 1 节 中 我 们 曾 提 出 这 样 的 问题 , 学 校 20 年 
前 作 过 普查 ,学 生 的 平均 身高 为 168cm, 要 通过 这 次 抽查 的 50 个 学 生 身 高 数据 ,对 学 生 的 
平均 身高 有 无 明显 变化 做 出 结论 . 如 果 把 168cm 作为 对 总 体 均值 的 假设 ,那么 问题 是 要 
根据 样本 对 这 个 假设 进行 检验 ,回答 只 有 两 种 ; 接受 或 拒绝 . 这 类 统计 推断 问题 称 为 假设 

像 参 数 估计 一 样 ,如 不 特别 指明 ,以 下 的 讨论 都 是 在 总 体 服从 正 态 分 布 的 假定 下 进 
行 的 . 


11.3 假设 检验 


11.3.1 总 体 均 值 的 假设 检验 


先 看 一 个 更 简单 的 例子 . 甲 方 生产 一 种 产品 的 尺寸 服从 均值 y 二 50、 标 准 差 一 1 的 
正 态 分 布 , 按 批 向 乙方 供 货 (每 批 的 数量 很 大 ) ,双方 商定 每 批 抽 取 25 件 ( 样 本 ) 测 量 其 尺 
寸 , 根 据 样本 均值 决定 乙方 是 否 接 受 这 批 产品 , 显然 ,必须 制定 一 个 数量 标准 5, 车 样本 均 
值 与 二 50 之 差 不 超 过 6, 就 应 接受 这 批 产品 ;否则 拒绝 , 应 该 看 到 ,由 于 样本 的 随机 性 ， 
不 论 8 多 大 ,这 种 检验 方法 总 可 能 犯错 误 ,如 一 批 合格 品 (w=50) 中 取出 的 25 件 的 均值 与 
50 之 差 超 过 了 56, 从 而 被 拒绝 . 所 以 在 制定 标准 6 时 ,双方 还 必须 商定 一 个 水 平 a, 使 合格 
品 被 错误 地 拒绝 的 概率 不 超过 a. 

设 商 定 的 水 平 二 0. 05, 让 我 们 看 看 如 何 确 定 5. 


i (容量 nn 二 25) 均 值 为 x. 由 (6) 邯 ,了 LN(0,1), 得 型 P 一 24 二 
记 样本 (容量 均值 为 .由 (6) 式 ,< 得 到 i | 


0.95 ,可 知 , 令 9 一 2o/vVna 一 2X1/5 一 0.4, 就 能 满足 上 面 的 要 求 , 即 当 |z 一 zx 委 0.4 时 应 接 
受 该 批 产品 ,否则 拒绝 . 按照 这 样 的 办 法 ,100 批 合 格 品 中 只 有 大 约 5 批 被 错误 地 拒绝 . 

设 抽取 一 容量 为 n 的 样本 ,得 到 均值 x 和 标准 差 : ,根据 样本 对 总 体 均值 y 是 否 等 于 
某 给 定 值 we 进行 检验 . 记 

. ,ss (13) 

称 互 , 为 零 假 设 (null hypothesis) (或 原 假设 ), 昌 ;为 备 选 假设 (alternative hypothesis) (或 
对 立 假设 ). 检验 的 结果 是 : 接受 妃 。 ,或 拒绝 瓦 ,, 即 接受 日). 应 首先 选 定 一 个 显著 性 水 平 
a, 它 是 本 来 有 ,成 立 , 但 被 错误 拒绝 的 概率 . 

仍 分 总 体 方差 已 知 和 未 知 两 种 情况 讨论 . 

(1) 总 体 方差 已 知 


者 本 ,成 立 ,由 (6) 式 ,名 ~NC0,1), 取 N(0,1) 的 1 一 a/2 分 位 数 轨 -oa , 记 = 一 
G/AV 7 


大 ,满足 P(x|<w-wn) 一 1 一 a( 仍 见 图 11.1), 于 是 候 设 检验 的 规则 ( 称 : 检验 或 检 


验 ) 为 : 
当 |z| 科 -时 接受 日 , ;否则 拒绝 五 (接受 万 ). 
(2) 总 体 方差 of 未 知 


着 日 ,成 立 ， 由 (9) 式 ， 到 大 ~tn 一 1), 取 tn 一 1) 的 1—a/2 分 位 数 bras = 


Ss/NN 


所 外, 请 足 P{t1<4-w} 一 1 一 a, 于 是 假设 检验 的 规则 ( 称 :检验 ) 为 
对 了 


当 1 < 时 接受 五 oj 否则 拒绝 五 (接受 互 ). 
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实际 上 常用 的 a 值 是 0. 05 或 0.01, 它 们 对 应 的 -ws 是 1.96 或 2.575, 当 nn 较 大 
(>30) 时 下- 与 由 -wz 相近 . 

可 以 看 到 ,假设 检验 所 依据 的 原理 与 参数 估计 是 一 样 的 ,都 依据 分 布 已 知 的 统计 量 (xz 
或 ) ,但 思维 方式 不 同 , 参 数 估计 的 思路 十 分 自然 .简明 ,而 假设 检验 的 思路 可 以 说 是 一 
种 “ 反 证 法 ”: 先 假设 瓦 。 成 立 , 则 zx 或 上 应 以 很 大 概率 1 一 a 落 在 一 个 区 域内 (如 |z| 反 
-wz), 于 是 当 由 一 个 样本 计算 出 的 数值 果然 落 在 该 区 域内 时 ,就 合理 地 接受 Ho, 而 一 旦 
它 不 落 在 该 区 域内 (如 |z| 盖 x-，* 称 拒绝 域 ), 可 以 认为 在 一 次 试验 中 发 生 了 小 概率 事 
件 , 那 么 就 从 反面 证 明 互 * 不 成 立 . | 

思考 ” 设 从 一 个 样本 得 到 z 二 2.2, 那么 若 取 a 二 0.05, 将 拒绝 日, ;车 取 a 二 0. 01 ,将 
接受 Ho. 你 怎样 评价 这 两 个 不 同 的 结果 ,考虑 到 a 是 错误 地 拒绝 有 ,的 概率 ,a 不 是 越 小 
越 好 吗 . 

双 侧 检验 与 单 侧 检 验 

假设 检验 (13) 式 是 对 w 是 否 等 于 某 值 yo 作 检 验 , 自然 应 将 拒绝 域 放 在 两 侧 ( 如 |z| 二 
U1-o/2) ,这 对 于 如 零件 尺寸 一 类 问题 的 检验 是 合适 的 .但 有 一 类 实际 问题 要 检验 的 是 形 如 
Lp 或 1 宇 po 的 假设 ,比如 11. 1. 3 节 中 的 硫 含量 ,检验 “均值 jy 不 大 于 国家 标准 值 
0.08%” 比 检验 “jy 等 于 0.08%” 更 合适 . 


记 
Ho: p&p Hi:y> pg. (14) 
这 时 应 将 拒绝 域 放 在 大 于 m 的 一 侧 . 当 总 体 方差 a 已 知 且 y= jp 时 ,根据 二 外 一 
G 了 2 
N(0,1), 取 NC0,1) 的 1 一 a 分 位 数 w_,( 见 图 11.4), 记 x 一 7 如 "有 P(z>w_,) 二 a. 而 
G n 


当 j<pw 时 ,上 述 概率 小 于 a. 于 是 假设 检验 的 规则 (z 检验 ) 为 : 
当 zx 人 Ul-。 时 接受 五 ;否则 拒绝 五 (接受 Hi). 


0 Li-w 


图 11.4 (14) 式 的 单 侧 检验 


11.3 假设 检验 


当 a 未 知 时 ,由 -各 一 Kx 一 ]) 类似 地 用 1 一 g 分 位 数 二 _, 作 t 检验 
5 nn 


可 以 类 似 地 检验 ee 

Ho: yy0; Hi: < po- (15) 
由 于 拒绝 域 设置 的 方式 不 同 , (13) 式 称 为 双 侧 检验 ,而 (14) 式 和 (15) 式 称 为 单 侧 
检验 . . 


11.3.2 总 体 方差 的 假设 检验 


总 体 方差 是 由 随机 因素 影响 的 大 小 决定 的 ,如 成 品 汽油 硫 含量 的 方差 主要 取决 于 生 
产 装置 和 生产 条 件 的 稳定 性 , 当 怀 疑 生产 的 稳定 性 时 ,可 对 方差 进行 假设 检验 . 与 均值 的 
假设 检验 相似 ,方差 的 假设 检验 也 有 以 下 的 双 侧 和 单 侧 检 验 : , 


Ho:so=o, Hi:o 0; po | (16) 

Ho:o go, Hi:o <a; SY 2 b17) 

Ho;: ao, Hi;o > oi. (18) 

检验 依据 的 原理 也 与 方差 区 间 估 计 相 同 ,对 于 双 侧 检验 (16) 式 , 互 成 立时 根据 (8) 式 

全 一 大 Oo 一 D 取 浆 分 布 的 wy/2 分 位 数 闪 。 和 1 一 w/2 分 位 数 故 .( 仍 见 图 11. 3)， 
令 ps -, 当 六 ,<< 光 壹 六 ,时 接受 采 。， 否则 拒绝 . 


Per 给 出 单 侧 检验 (17) 式 和 (18) 式 的 方法 ， 
11.3.3 两 总 体 的 假设 检验 


以 上 均值 和 方差 的 假设 检验 是 对 单一 总 体 而 言 ,实际 生活 中 还 经 常会 遇 到 通过 比较 
两 组 数据 对 两 个 总 体 进行 假设 检验 的 问题 .如 11. 1. 1 节 要 检验 城市 和 农村 地 区 同龄 男生 
的 身高 是 否 有 差距 ,11. 1. 2 节 要 检验 吸烟 群体 与 不 吸烟 群体 的 血压 是 否 相 同 ;用 原来 的 
材料 和 新 研制 的 材料 各 加 工 一 批 产 品 ,要 检验 新 材料 的 仁 能 有 无 显著 提高 . 这 类 问题 都 可 
归结 为 两 总 体 均值 的 假设 检验 ， 

(1) 两 总 体 均值 的 假设 检验 

记 两 个 总 体 为 X~N(jp,of) 和 Y~ NGCe ,地 )， 设 有 分 别 来 自 X,Y、 容 量 m,nz 的 两 
个 样本 ,得 到 均值 分 别 为 x,y 和 标准 差分 别 为 s; ,ss ,假设 检验 是 


Ho: L122; H,: 124 天 0Uaz， (19) 
当 cos 已 知 时 , 若 瓦 "成 立 , 可 以 证 明 
人 ” (20) 
df 


7] 好 2 


2 


ER 
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取 N(C0,1) 的 1 一 a/2 分 位 数 wu-w; 假 设 检 验 的 规则 (z 检验 ) 为 ; 
| 当 | z | 之 wa 时 接受 及, ;否则 拒绝 Ho (接受 Hi). 
当 O19?02 未 知 ,但 可 以 假定 010s 时 ,车 于 ,成立 , 可 以 证 明 


二 二 二 1 
2 ee ee (21) 
有 2 Nn 十 ns 一 2 


n1 nz 
取 ini 十 ns 一 2) 的 1 一 a/2 分 位 数 二 -wz ,假设 检验 的 规则 (2 检验) 为: 
当 | z | 二 -ws 时 接受 Ho; 否则 拒绝 ,接受 H,). 

(19) 式 是 双 侧 检验 ,也 可 以 类 似 于 (14) 式 和 (15) 式 , 作 单 侧 检 验 . 

值得 注意 的 是 ,有 一 类 两 组 数据 进行 比较 的 问题 ,看 似 属 于 两 总 体 均 值 的 假设 检验 ， 
实则 不 是 . 如 通过 同一 批 学 生 两 次 测验 成 绩 的 比较 ,检查 测验 的 难度 是 否 相 同 ,又 如 对 服 
用 茶 种 减肥 食品 的 若干 人 在 服用 前 后 测 其 体重 ,检查 这 种 减肥 食品 是 否 有 效 . 这 里 虽然 得 
到 的 是 两 组 数据 ,但 是 不 能 视 为 两 个 独立 的 样本 ,因为 两 组 中 的 一 对 数据 是 同一 个 体 产生 
的 . 请 你 考虑 : 如 何 根 据 成 对 的 两 组 数据 建立 合适 的 假设 检验 ,解决 提出 的 问题 ,11. 5 节 
将 布置 这 方面 的 实验 . 

(2) 两 总 体 方差 的 假设 检验 

记 两 个 总 体 为 X~NCysof) 和 Y~NCpz ,0), 设 有 分 别 来 自 关 ,了 Y, 容 量 ni ,nz 的 两 个 
样本 ,得 到 标准 差分 别 为 5 ,sz, 要 做 的 假设 检验 是 


Ho:of=0,， Hi:o 关 oi. (22) 
回顾 实验 10 中 的 x? 分 布 和 下 分 布 的 定义 ,可 以 证 明 , 当 肪 ,成 立时 
2 
ee et (23) 
2 


类 似 于 一 个 总 体 方 差 的 假设 检验 (16) 式 ,可 以 取 Fn 一 1,ns 一 1) 分 布 的 o/2 分 位 数 
Fn 和 1 一 a/2 分 位 数 -ws 令 = 与, 当 Fn 过 F<Fi_ws 时 接受 H。， 否则 拒绝 . 这 是 双 
侧 检 验 , 而 实际 上 为 方便 起 见 , 常 将 其 化 为 如 下 的 单 侧 检验 : 两 个 样本 方差 中 较 大 的 一 个 
记 作 吕 , 即 叶 实 吕 , 取 Gn 一 1 一 1) 的 1 一 a/2 分 位 数 局， 假设 检验 的 规则 ( 称 严 检 
验 ) 为 ; 

当下 之 Ew 时 接受 上 H, ;否则 拒绝 有 (接受 Hi). 


注意 , 其 置信 水 平 仍 为 1 一 a 
11.3.4 0-1 分 布 总 体 均值 的 假设 检验 


试看 这 样 一 个 检验 问题 ; 甲 方 向 乙方 成 批 供 货 ,双方 商定 废品 率 不 超过 3%%. 今 从 一 
批 中 抽取 100 件 ,发现 有 5 件 废品 , 间 乙 方 是 否 应 接受 这 批 产品 . 设 预先 约定 的 显著 性 水 
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平 < 王 0.05， 

这 里 的 一 件 产品 只 有 合格 品 与 废品 之 分 ,用 X=0 表示 合格 品 ,XX 二 1 表示 废品 ,可 以 
说 总 体 和 服从 0-1 分 布 . 车 废品 率 为 p, 则 容易 计算 X 的 期 望 y 一 p, 方 差 6 二 p(1 一 p). 
虽然 和 不 服从 正 态 分 布 , 但 根据 概率 论 的 中 心 极限 定理 , 当 样 本 容量 n 充分 大 时 ,对 样本 


均值 有 'z 一 天 近似 地 服从 N (0,1) ,由 此 可 对 总 体 的 废品 率 p 作 如 下 的 假设 检验 ; 
[se n 


Ho: p= po, Hi: pA po (24) 
利用 正 态 总 体 均 值 的 x 检验 , 取 N(0,1) 的 1 一 a/2 分 位 数 wwa, 设 样本 的 废品 率 为 
二 记 s 一 3 亏 " 消 足 P{|z|<w-w) 一 1-as 于 是 假设 检验 的 规则 为 
当 | 之 Eg Ul—a/2 时 接受 互 , ;否则 拒绝 五 。 (接受 互 ; )， 
上 面 是 双 侧 检验 ,而 对 废品 的 检查 更 合适 的 假设 检验 为 : 
Ho: ppo, Hi: p> po. (25) 
这 时 应 作 单 侧 检验 , 取 N(0,1) 的 1 一 a 分 位 数 u1-, ,假设 检验 的 规则 为 : 
当 xz 之 wi。 时 接受 互 , ;否则 拒绝 互 o (接受. 了 Hi). 
用 这 个 规则 回答 前 面 乙 方 是 否 应 接受 那 批 产 品 的 问题 . 将 x 二 5/100, po 一 0. 03 ,7 一 
100 代 人 得 z= 二 1,1724, 用 单 侧 检验 ,a 二 0.05 时 4-, 二 1. 65, 最 然 x< 委 zi 乙方 应 接受 
Pp 声 po 的 假设 , 即 接受 那 批 产 品 . 
思考 109 件 中 有 5 件 废品 , 却 还 要 接受 废品 率 为 3% 的 假设 ,如 果 你 是 乙方 代表 ,你 
愿意 接受 吗 ? 问题 出 在 什么 地 方 ? 若 提 高 显著 性 水 平 a, 会 有 什么 后 果 ? 


11.3.5 总 体 分 布 正 态 性 检验 


。 进行 参数 估计 和 假设 检验 时 ,通常 总 是 假定 总 体 服 从 正 态 分 布 ,虽然 在 许多 情况 下 这 
个 假定 是 合理 的 ,但 是 当 要 以 此 为 前 提 进 行 重要 的 参数 估计 或 假设 检验 ,或 者 人 们 对 它 有 
较 大 怀疑 的 时 候 , 就 确 有 必要 对 这 个 假设 进行 检验 , 

进行 总 体 正 态 性 检验 的 方法 有 很 多 种 ,以 下 针对 MATLAB 统计 工具 箱 中 提供 的 程 
序 ,简单 介绍 几 种 方法 . 

(1) Jarque-Bera 检验 

实验 10 中 曾 介绍 过 正 态 分布 的 偏 度 gi 一 0, 峰 度 gz 一 3, 对 于 一 个 样本 按照 实验 10 
的 (4) 式 计算 其 g; 和 gs, 若 样本 来 自 正 态 总 体 , 则 gi 和 gs 应 分 别 在 0 和 3 附近 . 基于 这 个 
思想 ,构造 一 个 包含 g1 ,gs 的 x? 分 布 统计 量 (自由 度 4 二 2) ,对 于 显著 性 水 平 a. 当 x? 分布 
统计 量 小 于 x 分 布 的 1 一 a 分 位 数 x?_ 时 ,接受 有 H。: 总 体 服从 正 态 分 布 ;否则 拒绝 HH ， 
即 总 体 不 服从 正 态 分 布 . 

这 个 检验 适用 于 大 样本 , 当 样 本 容量 ” 较 小 时 需 愤 用 . 
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(2) Kolmogorov-Smirnov 检验 

通过 样本 的 经 验 分 布 函 数 与 给 定 分 布防 数 的 比较 ,推断 该 样本 是 否 来 自给 定 分 布 函 
数 的 总 体 . 容量 n 的 样本 的 经 验 分 布 函数 记 为 F(x) ,可 由 样本 中 小 于 之 的 数据 所 占 的 比 
例 得 到 ,给 定 分 布 函数 记 为 G(z), 构 造 的 统计 量 为 DD， 一 max( |F,(z) 一 G(xz)|), 即 两 个 
分 布 函数 之 差 的 最 大 值 , 对 于 假设 映 。:; 总 体 服从 给 定 的 分 布 GC(z), 及 给 定 的 4, 根据 DD， 
的 极限 分 布 (n 一 co 时 的 分 布 ) 确 定 统计 量 关 于 是 否 接 受 肪 ,的 数量 界限 . : 

因为 这 个 检验 需要 给 定 CCz), 所 以 当 用 于 正 态 性 检验 时 只 能 做 标准 正 态 检验 , 即 
豆 。: 总 体 服 从 标准 正 态 分 布 N(0,1). 

(3) Lilliefors 检验 

它 将 Kolmogorov-Smirnov 检验 改进 用 于 一 般 的 正 态 性 检验 , 即 互 , : 总 体 服从 正 态 
分 布 NGC; 到) ,其 中 mo 由 样本 均值 和 方差 估计 . : 


11.3.6 假设 检验 的 MATLAB 实现 


将 11.3.1 节 至 11. 3.5 节 讨 论 的 各 种 假设 检验 、 相 应 的 统计 量 和 检验 规则 以 及 
MATLAB 统计 工具 箱 中 提供 的 命令 列 入 表 11. 3( 单 侧 检 验 未 列 入 ). 


表 11.3 假设 检验 及 其 MATLAB 命令 


假设 检验 统计 量 检验 规则 MATLAB 命令 
| | h=ztest(x, mu, sigma) 
单个 总 体 均 值 Ho: HA 二 AH Zz 一 0 |z| 委 上 -ov 
一 ~N(0,1) ,Sig, ci, = 9 
CE Hi pp z I 接受 Hz 检验 ) [h sig ci,zval] ztest(x 
mu, sigma, alpha, tail) 
单个 总 体 均值 | 也 可 区 h= ttest(x, mu) 
人 下 总 钵 0: 4 二 AHA0 PR nd ee tl | RS 
1 一 一 名 一 :2 一 1) [h, sig, ci] = ttest (xy mu 
Hi: ; 受 Holt ) ee 
(o 未 知 ) 1: HU 天 /140 sm 接受 Holt 检验 alpha,tail) 
Ho: :=o 1)62 2 2 2 
单个 总 体 方差 | = Da) Xx 拉 
Hi: Fo oo 受 Ho 
两 个 总 体 均值 | Ho: pi 二 po = 3 一 NG0,1) | = | 委 w-wz 接 无 
(oo 已 知 ) | Hi: 由 天 pa Si 受 Ho- 
nl nt2 
| h= ttest2Cx,y) 
fe ee Rr J 
两 个 总 体 均值 | Ho: pi =p 于 二 三 [lire (x,y,alpha, tail) 
( ?2g Hi: Ea 受 瓦 
ta ,Cn Det Cn —1)s: i 
| nl 十 zz 一 2 
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、 
假设 检验 统计 重 检验 规则 MATLAB 命令 
2 

Ho: ot =0 下 = 一 一 Fn 一 lv- 一 1D)， FF- 
两 个 总 体 方差 | ， ，，， ， et 无 

万 : ai 天 cz i 接受 HH。 

51 之 52 

0-1 分 布 总 体 | Po : p=po X— po [|z| ui- 无 
均值 Hi: pApo Vpoll— po)/n 接受 H。 

HH 总体 服 从 h= jbtest(x) 

Sh 路 略 [h,p,jbstat,cvj = 
Np ) 3 
jbiest(x,alpha) 
总 体 分 布 正 | 昌 : 总 体 服从 
态 性 No 1) 赂 略 h =kstest(x) 
h = lillietest(x) 
Ho : 总 体 服从 广 -一 一 一 一 
路 略 [h,p,lstat, cv]= 
NGC) i 
: lillietest(x, alpha) 


表 11. 3 最 后 一 列 MATLAB 命令 的 两 格 中 ,上 面 是 最 简 形 式 , 下 面 是 完全 形式 . 现 以 
单个 总 体 均 值 z 检验 的 命令 为 例 说 明 用 法 . 


[hysig,ciyzva 由 =ztest(x,muysigmayalphaytail) 


输入 参数 x 是 样本 (n 维 数组 ) ,mu 是 HH 中 的 po ,Sigma 是 总 体 标准 差 c,alpha 是 显 
著 性 水 平 <( 软 认 时 设 定 为 0.05) ,tail 是 对 双 侧 检验 和 两 个 单 侧 检验 的 标识 ,用 备 选 假设 
五 确定 : 已 ;为 yp 时 令 tail 王 0( 可 默认 ); 五 ;为 LA> po 时 令 tail 一 1; 五 ;为 Kp 时 令 
tail= 一 1. 

输出 参数 h=0 表示 接受 五 o, h=1 表示 拒绝 五。 ，sig 是 在 假设 互 , 下 的 概率 忆 (12| 


之 |z|) ,其 中 Z~N(0,D ,< 全 ( 详 见 下 面 例 1 的 说 明 ) ，ci 给 出 mm 的 置信 区 间 ,zval 
G/NnN 


是 样本 统计 量 z 的 值 . 

其 他 命令 的 用 法 类 似 , 只 需 说 明 的 是 ,两 个 总 体 均 值 检验 合 证 令 ttest2 需要 输入 两 个 样 
本 x 和 y( 长 度 不 一 定 相 同 ). 

例 1 用 NN(5,1?) 随 机 数 产 生 n==100 的 样本 ,分 别 在 总 体 方差 已 知 (2 一 =1) 和 未 知 的 
情况 下 检验 总 体 均 值 kw 一 5 与 kw 一 5.25(a 一 0.05). 

解 ”假设 检验 分 别 为 瑞 , :pe 一 5; :1 关 5 与 Ho:p 一 5. 25; Bi :pi 天 5.25, 总 体 方差 已 
知 时 用 = 检验 ,未 知 时 用 上 检验 ,编程 如 下 : 


x=normrng(5, 1,100,1); % 产生 NG5,12) 随 机 数 Cn= 100) 


a 
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m= mean(x), % 样本 均值 
[h0 ,sig0,ci0,z0]= ztest(x,5, 1) %z 检验 
[h1,sig1,ci1,z1]= ztest(x,5.25,1) 
[ht, sigt, cit] = ttest(x,5) %t 检 验 
[Lht1, sigt1 ,cit1}= ttest(x,5.25) 

得 到 
m = 三 4.9323 


[ho ,sig0,ci0,z0]j=0 0.4984 4.7363 5.1283 一 0.6770 
[Lhi1,sigl,cil,z1]=1 0.0015 4.7363 5.1283 一 3.1770 
[ht, sigt, cit}= 0 0.4903 4.7383 5.1263 
[Lhti,sigt1,cit1]= 1 0.0016 4.7383 5.1263 


从 计算 结果 可 知 , 样 本 均值 了 一 4. 9323, 且 : 
(1) 对 = 检验 和 + 检验 都 接受 了 ==5 的 假设 ,拒绝 了 /一 5. 25 的 假设 ; 


(2) 对 检验, 在 Ho: pw 一 5 下 样本 统计 量 20 一 一 0. 6770( 


5 
Fe 二 《4.9323 一 5)X 
1/vn ' 


10) ,在 瓦 "下 的 概率 sig0=0.4984(=2* normcdf(z0)) ,由 样本 对 总 体 均值 py 的 区 间 估 计 
为 [4.7363 5.1283j; 

(3) 对 = 检验 ,在 Hsp 一 5.25 下 样本 统计 量 z1 一 一 3.1770( 一 如) ,在 HH, 下 

/Nn 

的 概率 sig1 一 0. 0015( 二 2 xnormcdf(z1)), .的 区 间 估 计 同 上 ; 

(4) 对 zt 检验 ,在 五。: y= 二 5 下 (t0 未 输出 ,但 可 以 由 (9) 式 计算 ) 的 概率 sigt=0; 4903 
(二 2x tcdf(t0,n 一 1)) ,对 总 体 均值 jy 的 区 间 估 计 为 [4. 7383 5. 1263]; 5 

(5) 对 上 检验 ,在 互 。: wk 一 5.25 下 的 概率 sigt1 一 0.0016，w 的 区 间 估 计 同 上 . 


特别 指出 ,ztest 中 的 输出 sig 是 五 ,下 的 概率 P{|12Z| 之 |z|}, 其 中 Z~N(0,1),z= 
一 全 ,z 偏 离 uo 越 大 , |z| 越 大 ,sig 二 PI1Z| 宕 |z|) 越 小 ,所 以 可 以 认为 sig 给 出 了 接受 


ns 
TU sig 之 a) 或 拒绝 日 ,( 此 时 sig<a) 的 定量 指标 . ttest 和 ttest2 中 的 输出 sig 有 类 似 
的 含义 ,只 需 换 成 1 分 布 和 1 统计 量 . 

和 2 用 NN(5,1’) 随 机 数 产 生 n= 二 100 的 样本 ,在 总 体 方差 未 知 的 情况 下 分 别 取 a= 
0.05 和 a 二 0.01 检验 总 体 均值 之 5. 2. 

解 ” 作 单 侧 检验 瑟 , :xy 宇 5.2, 理 ! ;py 过 5.2, 用 zt 检验 ,编程 如 下 (注意 alpha 和 tail 的 
取 值 ) : 


x 三 normrnd(5,1,100.,1); 
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m = mean(x), 
[Lh1,sigl,ci1l] = ttest(x,5.2,0.05,~—1) 
[h2 ,sig2,ci2] = ttest(x,5.2,0.01, 一 1) 


得 到 


m = 5.0111 
[Lhi,sigl,cil] =1 0.0343 -Inf 5.1815 
[h2,sig2,ci2] =0 0.0343 -Inf 5.2537 


可 知 在 a 二 0.05 下 拒绝 日 ,《( 此 时 sig1<a) ,yp 的 区 间 估 计 ( 一 ,5.1815] 不 包含 5. 2; 
而 在 a 二 0.01 下 接受 五 o( 此 时 sig2>>a) ,wp 的 区 间 信 计 ( 一 oo ,5. 2537] 包 含 5. 2. 

例 3 分 别 用 NN(5, 二 ) 和 NC(5.2,0.8) 随 机 产生 nn 二 100 的 样本 ,分 别 在 两 个 总 体 标 
准 差 已 知 (o =1,o 一 0.8) 和 未 知 的 情况 下 检验 两 个 总 体 均值 二 ps (a 二 0.05). 


解 ” 两 个 总 体 标准 差 已 知 的 情况 需 自 编程 序 , 以 下 是 名 为 ztest2. m 的 函数 M 文件 ， 


(包括 双 侧 和 单 侧 检 验 , 标 识 tail 的 用 法 与 ztest 相同 ,所 有 输入 参数 不 可 省 略 ) 


function [h,sig|= ztest2(x,y,sigmal,sigma2 ,alpha, tail) 
n1= length(x); 
n2 = length(y); 
xbar= mean(x); 
ybar= mean(y): 
z= (xbar— ybar) /saqri(sigma1*2/n1+ sigma2°2/n2); 
if tail== 
u=norminv(1— alpha/2); 
sig=2 x* (1~ normcdf(abs(z))); 
if abs(z)==u 
h=0; 
else 
h=1; 
end 
end 
if tail== 1 
u=norminv(1— alpha); 
sig= 1 一 normcdf(z); 
if z<< =u 


end 
if tail== 一 1 
u= norminv(alpha); 
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sig=normcdf(z); 
if z>=U 


end 
然后 按照 题目 要 求 作 假设 检验 日 。 :m 二 jw ,编程 计算 : 


Xx=normrnd(5 ,1 100,1); 
y= normrnd(5.2,0.8,100,.); 
Ep,sig] =ztest2(x,y,1,0.8,0.05,0), 
Ept, sigt] = ttest2 (x,y) 
. 得 到 
[p,sig] = 0 0.1048 
[pt,sigt]= 0 0.1335 
我 们 看 到 ,虽然 产生 样本 的 两 个 总 体 的 均值 不 同 (5 和 5. 2) ,但 是 仍然 接受 了 j==j, 的 假 


11.4 实例 的 求解 
以 下 11.4.1 节 一 11.4.3 节 分 别 是 对 11.1.1 节 ~11.1.3 节 所 提问 题 的 求解 . 


11.4.1 学 生 身 高 的 变化 ( 续 ) 


问题 (1) 在 参数 估计 11. 2. 5 节 中 已 经 由 样本 (50 名 17 岁 城 市 男性 学 生 身 高 ) 得 到 
了 总 体 均 值 kw 王 172. 7040 ,其 区 间 估 计 为 L171. 1777 174.2303](a 二 0.05). 

问题 (2) ”已 知 20 年 前 同一 所 学 校 同龄 男生 的 平均 身高 为 168cm, 为 回答 学 生 身 高 
是 否 发 生 了 变化 ,作假 设 检验 


Ho: re 168; Hi: 4 168. (26) 
不 妨 先 对 样本 作 正 态 性 检验 ,再 用 t 检 验 ,编程 如 下 (a 二 0.05)， 
x=[170.1... 172.2]; % 50 名 17 岁 城 市 男性 学 生 身 高 数据 (从 略 ) 
h1 = jbtest(x) 
h2= lillietest(x) 
Lh,sig,ci] = ttest(x, 168) 
得 到 


hl =0,， h2=0， 
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[h,sig,ci]= 1 1.1777e—007 171.1777 174.2303. 

结果 显示 ,通过 了 正 态 性 检验 ,拒绝 五 ,表明 学 生 身 高 的 确 发 生 了 变化 . 

问题 (3) ”要 求 由 收集 的 城市 和 农村 中 学 的 数据 回答 ,两 地 区 同龄 男生 的 身高 是 否 有 
差距 ,作假 设 检 验 

Ho: pa =p Hi:p pz (27) 

这 里 jw ,pz 分 别 是 城市 和 农村 中 学 同龄 男生 的 身高 .题目 中 只 给 出 从 100 名 同龄 农村 男 
性 学 生 身 高 算出 的 样本 均值 168. 9 各 标准 差 5. 4, 没有 原始 的 样本 数据 ,为 了 直接 用 
MATLAB 命令 ttest2 计算 ,需要 索取 原始 数据 . 假定 我 们 得 到 了 这 100 个 数据 ,并 认为 服 
从 正 态 分 布 ,用 如 下 运算 作 检验 (ae 一 0. 05) : 


y=[166.3 .… 167.3]; % 100 名 同龄 农村 男性 学 生 身 高 数据 (从 了 略 ) 
[h, sig,ci]= ttest2(x,y) 
计算 结果 为 


[Lh,sig,ci]= 1 7.0945e 一 005 1.9773 5.6767 


即 拒绝 态 , ,表明 城市 与 农村 17 岁 年 龄 组 学 生 ( 总 体 ) 的 身高 有 显著 差异 ,差距 的 置信 区 间 
为 [1.9773 5.6767] (a==0.05). | 


11.4.2 了 豚 烟 对 血压 的 影响 ( 续 ) 

为 了 研究 吸烟 对 血压 的 影响 .测量 了 吸烟 组 (66 人 ) 和 不 吸烟 组 (62 人 ) 两 组 人 群 的 6 
项 血压 指标 , 表 11.1 给 出 的 是 经 过 简单 处 理 后 的 数据 一 一 两 组 人 群 6 项 血压 指标 的 样本 
均值 与 标准 差 . 要 根据 这 些 数 据 推断 吸烟 对 血压 有 无 影响 ,我们 分 别 对 6 项 血压 指标 作假 


设 检验 


Ho:ipa=p, Hip (28) 
其 中 ma ,pz 分 别 是 吸烟 和 不 吸烟 群体 (总 体 ) 的 血压 指标 . 
像 11.1.1 节 中 没有 100 名 同龄 农村 男性 学 生 身 高 的 原始 数据 一 样 , 这 里 也 没有 66 
位 吸烟 者 和 62 位 不 吸烟 者 的 血压 指标 . 假设 无 法 得 到 这 些 原始 数据 ,不 能 直接 用 
MATLAB 命令 ttest2 计算 ,我 们 转 而 在 吸烟 和 不 吸烟 两 个 群体 的 血压 指标 均 服 从 正 态 分 
布 , 且 两 个 未 知 方差 相等 的 假设 下 ,利用 11.3.3 节 (21) 式 的 上 检验 进行 计算 . 


以 两 个 样本 的 均值 (xbar ,ybar)、 标 准 差 (s1 ;,S2) 和 容量 (m,n) 为 输入 参数 ,编写 一 个 . 


名 为 pttest2. m 的 函数 M 文件 (包括 双 侧 和 单 侧 检 验 , 标 识 tail 的 用 法 与 ztest 相同 ,所 有 
输入 参数 不 可 省 略 ) : 
function flh,sig]= pitest? (xbar, ybar, s1, s2 ,m,n,alpha, tail) 


spower= ((m— 1) *s1"2+ (n-1) x s2°2)/ (m+n-2); . 
t= (xbar~— ybar)/sqrt(spower/m+ spower/n); 
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if tail== 0 
a= tinv(1— alpha/2,m+n—~2); 
sig =2x (1— tcdf(abs(t) ,m+ n—2)); 
if abs(t)=<=a 
h=0; 
else 
h=1; 
end | 
end 
if tail = = 
a=tinv(1—alpha, m+ n— 2); 
sig =1— tedf(t,m+n—2); 


if t<=a 
h=0; 
else 
h=1; 
end 
end 


if tal== 一 1 
a=tinv(alpha, m+n—2); 
sig =tcdf(t,m+n—.2); 
it 之 三 3 
h=0; 
else 
h=1; 
end 
end 


用 表 11. 1 给 出 的 数据 , 取 aipha 二 0.05,tail==0, 由 pttest2 计算 的 结果 见 表 11. 4. 可 
以 看 出 , 除 夜间 (10Pm-6Am) 平 均 收缩 压 CnSBP) 外 ,其 余 5 项 指标 都 拒绝 了 日, ,于 是 综 
合 起 来 可 以 认为 ,吸烟 对 血压 的 影响 显著 . 


表 11.4 “上 豚 烟 对 血压 的 影响 "假设 检验 的 计算 结果 


h sig 接受 或 拒绝 HH。 
24hSBP/mmHeg 1 8. 5097e 一 003 拒绝 
24hDBP/mmHeg 1 3. 1860e 一 003 拒绝 

dSBP/mmHg | 5. 3064e 一 003 拒绝 
dDBP/mmHg | 3. 9950e-—003 拒绝 

nSBP/mmHg 0 | 13597e 一 001 接受 
nDBP/mmHg 1. 3027e 一 002 拒绝 


11.4 实例 的 求解 


11.4.3 汽油 供 货 合同 ( 续 ) 


加 油 站 (乙方 ) 以 含 硫 量 不 超过 0. 08% 的 标准 决定 是 否 接受 炼油 厂 ( 甲 方 ) 提 供 的 一 
批 汽油 . 双方 商定 每 批 抽检 10 辆 车 , 现 得 到 了 一 批 10 个 含 硫 量 数据 ( 见 11. 1. 3 节 ). 

问题 (1) ”只 根据 这 些 数据 推断 乙方 是 否 应 接受 该 批 汽 油 ; 如 果 甲 方 是 可 靠 的 供 贷 
商 ,并 且 对 产品 的 稳定 性 提供 了 进一步 的 信息 ,乙方 对 应 的 策略 有 什么 变化 ? 

推断 乙方 是 否 应 接受 该 批 汽 油 ,等 价 于 根据 样本 作 总 体 均值 p 的 ( 单 侧 ) 假 设 检 验 ， 


Ho: py po = 0.08, Hi: > po = 0.08. (29) 
分 以 下 几 种 情况 讨论 ; 
1 如 果 只 根据 这 些 数据 作 检 验 , 是 在 总 体 方差 未 知情 况 下 的 1 检验 ,编程 计算 . 
x=[0.0864 … 0.0880]; % 10 个 含 硫 量 数据 ( 见 11.1.3 节 ) 
xbar= mean(x) % 样本 均值 
[h,sig] = ttest(x,0.08,0.05,1) % 长 单 侧 ) 检 验 ( 设 ac=0.05) 
得 到 
xbar= 0.0857 


[h,sigj= 1 0.0424 

拒绝 五 , 即 乙方 不 接受 该 批 汽油 ,但 是 我 们 注意 到 sig 接近 0. 05( 当 sig 之 0.05 时 接 
受 互 ,) ,所 以 它 已 接近 于 接受 HH. 

还 注意 到 样本 均值 zx 一 0.0857 之 mm 一 0.08. 

2， 如果 甲 方 是 可 靠 的 供 货 商 ,不妨 请 甲 方 提供 总 体 方差 (一 般 方 差 比 较 稳 定 ), 这 比 
上 面 :检验 中 用 小 样本 (一 10) 计 算出 样本 方差 更 为 可 靠 . 

若 甲 方 提供 总 体 标准 差 为 c 二 0.01 , 则 由 

[h, sig]=ztest(x,0.08,0.01,0.05,1) % z( 单 侧 ) 检 验 ( 设 &« ==0.05) 
计算 得 到 

[h, sigj= 1 0.0357 
拒绝 互 。, 即 乙方 不 接受 该 批 汽油 . 

若 甲 方 提 供 总 体 标准 差 为 ce 一 0. 015 , 则 由 


[h, sig]=ztest(x,0.08,0.015,0.05,1) 


We 


h，sigj= 0 0.1147 
接受 吾 ,, 即 乙方 接受 该 批 汽油 . 
思考 ”为 什么 so 二 0.01 时 拒绝 互 。, 而 c 一 0. 015 时 接受 五 .7 
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如 果 生 产 比 较 稳定 , 即 方差 较 小 ,在 有 H,。 下 出 现 较 大 的 硫 含量 偏差 的 可 能 性 应 较 小 ， 
但 是 该 批 出 现 了 这 样 大 的 样本 均值 zx 一 0.0875, 从 而 说 明 五 不 成 立 ， 

当 生 产 不 很 稳定 , 即 方差 较 大 时 ,在 ,下 出 现 较 大 的 硫 含量 偏差 的 可 能 性 加 大 ,于 
是 该 批 出 现 这 样 大 的 样本 均值 还 是 可 以 接受 的 . 

3. 车 对 甲 方 产品 的 信任 度 很 高 ,不妨 将 显著 性 水 平 由 a 二 0.05 改 为 a==0.01, 重 新 作 
总 体 方差 未知 情况 下 的 检验 : 


[h,sig] = ttest(x,0.08,0.01,1) 
得 到 

[h,sigl]= 0 0.0424 
接受 H。. 

同一 个 样本 用 于 同样 的 假设 检验 ,在 不 同 的 显著 性 水 平 a 下 会 得 到 不 同 的 结论 . 这 启 
示 我 们 有 必要 研究 如 何 恰当 地 选取 a. 因为 是 原本 成 立 的 互 ,被 错误 地 拒绝 的 概率 ,而 
在 假设 检验 中 原 假设 媚 , 一 般 是 受 保护 的 ,不 轻易 拒绝 它 , 所 以 n 一 般 取 得 很 小 ,并 且 也 。 
越 可 靠 ,a 越 小 . 在 上 面 的 问题 中 甲 方 一 向 信誉 很 好 , 减 小 a 是 合适 的 . 

在 统计 推断 中 将 “原本 成 立 的 昌 , 被 拒绝 ”所 犯 的 错误 ( 即 “ 弃 真 ”) 称 为 第 一 类 错误 ， 
犯 第 一 类 错误 的 概率 为 a.a 是 否 越 小 越 好 呢 ? 这 需要 从 另 一 个 角度 看 这 个 问题 . 

问题 (2) 现 乙方 与 一 新 炼油 厂 ( 丙 方 ) 谈 判 ,并 且 风 闻 丙 方 有 用 含 硫 量 0.086% 的 汽 
油 顶 蔡 合 格 品 的 前 科 , 那 么 如 果 乙 方 沿用 与 甲 方 订 的 合同 ,会 有 什么 后 果 . 


假设 检验 仍 是 (29) 式 ,在 总 体 服从 Ne2) 的 条 件 下 ,由 (9) 式 二 一 必 J 一 tn 一 1), 取 


ni 


显著 性 水 平 4, 若 意 体 均 信 /一 As ,根据 单 全 检验 的 规则 ， 当 = 二 名 大 5- 时 ,接受 岂 , 且 所 
S n 


受 态 , 的 概率 为 
PIB = = 1—ea. (30) 
s/ Vn . 
下 面 分 别 考察 当 总 体 均 值 A= pp 和 HL=p2 > po 时 接受 H, 的 概率 : 


1. 著 7， 一 站 二, 则 三 一 二 -名 一 xn 一 1) ,由 
右 /一 Ai 全 Ho 1 本 


1 _T 一 Ah 工 一 m 士 一 Ai 一 /十 如一 外， 
s/ Vn s/ Vn SA 


得 到 
P{tz 0 ti 奈 bio i (31) 


即 接受 及 ,的 概率 比 py 二 po 时 的 概率 1 一 a 大 . 因为 pi 过 po， 这 是 很 自然 的 ， 如 图 11. 5(a) 


11.4 实例 的 求解 


中 ., 左 侧 实 线 下 面 的 面积 是 1 一 a, 虚 线 下 面 的 面积 大 于 1 一 a. 
2. 车 1 二 pj 之 pw ,如 一 旦 丙 方 提供 的 汽油 含 硫 量 为 二 0. 086 之 jo 二 0.08, 则 二 
Ei 2 —1)，, 仿 验 规 见 -< .时 接受 H。. 
Sn 而 根据 检验 规则 仍 是 上 本 t1-。 时 接受 由 
_ZX—p _ Xpotpomp 2 
s/ Vn s/ Vn s/ Vn 
Pl ta}=P 2 < 一 笃 一 名 (32) 
t < 站 {: t i | 
这 是 左 瑟 , 不 成 立 的 条 件 下 《y=jo 之 jp) ,由 于 三 -< 而 仍然 接受 五。 的 概率 . 
在 统计 推断 中 将 “原本 不 成 立 的 五 被 接受 ”所 犯 的 铺 误 ( 即 “ 取 伪 ”) 称 为 第 二 类 错 
误 , 犯 第 二 类 错误 的 概率 记 作 8, 由 (32) 式 
B= Pts: < ti | = Foy (te), te = be Ts (33) 
其 中 Fu 是 i《n 一 1 ) 分 布 的 分 布 函 数 . 


tz 


(HINHo) hia | (HojH) tie 
(@) AR=i 过 jo 时 接受 Ho 的 概率 (b) HA=12 > Lo 时 接受 Ho 的 概率 


图 11.5 


图 11.5(b) 中 4-, 左 侧 实 线 下 面 的 面积 是 1 一 x, 即 “|” 线 标示 的 区 域 面积 为 pw 一 时 
犯 第 一 类 错误 的 概率 为 a; 而 t-, 左 侧 虚 线 下 面 的 面积 (“一 ” 线 标示 的 区 域 面积 ) 正 是 /一 
pL 这 jw 时 接受 日,, 即 犯 第 二 类 错误 的 概率 8. 可 以 看 出 , 当 v 变 小 时 ,所 -。 右 移 ,8 增 加 . 

现在 假定 乙方 与 两 方 谈 判 时 沿用 与 甲 方 订 的 合同 ,并且 丙 方 果然 提供 了 含 硫 量 


0.086% 的 汽油 ,不 妨 设 测量 的 10 个 样本 数据 与 题目 中 甲 方 提供 的 相同 ,我 们 看 看 接受 . 


Ho , 即 犯 第 二 类 错误 的 概率 8 有 多 大 . 
按照 (33) 式 编程 计算 (wx 一 0. 05) : 


x=[0.0864 … 0.0880]; % 10 个 含 硫 量 数 据 ( 见 11.1.3 节 ) 
mu0=0.08; mu2=0.086; n= 10; 

alpha=0.05; 

talpha= tinv(1 一 alphayn 一 1); 

s= std(x); 
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gap= (mu2— mu0)/(s/sqgrt(n)); 
beta= tcdf(talpha 一 gap,n 一 1) 
得 到 
beta =0.4211 
改变 a 进行 计算 , 表 11.5 给 出 了 不 同 显著 性 水 平 a( 第 一 类 错误 的 概率 ) 下 第 二 类 错 
误 的 概率 A. 
表 11.5 不 同 显著 性 水 平 a 下 第 二 类 错误 的 概率 


显著 性 水 平 a 0.01 0.05 0.1 0.2 0.3 


第 二 类 错误 8 0. 7733 0. 4211 0. 2644 | 0. 1390 0. 0846 


可 见 , 为 了 避免 第 二 类 错误 的 概率 太 大 ,应 该 适当 提高 显著 性 水 平 . 当然 ,8 除了 随 着 
a 的 减 小 而 增加 外 ,还 与 yz (之 po) 的 大 小 有 关 . 

在 统计 推断 中 原 假设 瓦 与 备 选 假设 瓦 ,是 不 平等 的 ,人 们 一 般 将 值得 信赖 的 不宜 
轻易 否定 的 假设 取 作 原 假 设 , 显 著 性 水 平 a 一 般 不 超过 0. 05 ,这 时 犯 第 二 类 错误 的 概率 8 
有 多 大 ,是 乙方 (如 受 货 方 ) 关 心 的 问题 之 一 . 


11.5 实验 练习 - 


1. 掌握 数据 的 参数 估计 假设 检验 的 基本 原理 ,算法 ,及 用 MATLAB 实现 的 方法 ; 

2. 练习 用 这 些 方法 解决 实际 问题 . 

实验 内 容 

1. 某 厂 从 一 台 机 床 生产 的 滚珠 中 随机 抽取 9 个 , 测 得 直径 (mm) 如 下 : 

14.6,14.7,15.1,14.9,14.8,15.0,15.1,15.2,14.8 

设 滚珠 直径 服从 正 态 分 布 , 试 自行 给 出 不 同 的 显著 性 水 平 ,对 直径 的 均值 和 标准 差 作 
区 则 估计 ， 

2.， 据说 某 地 汽油 的 价格 是 115 美 分 /gal ,为 了 验证 这 种 说 法 ,一 位 司机 开车 随机 选 
择 了 一 些 加 油 站 ,得 到 某 年 1 月 和 2 月 的 数据 如 下 : 
1 月 119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118 
2 月 118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125 

(1) 分 别 用 两 个 月 的 数据 验证 这 种 说 法 的 可 靠 性 ; 


加仑. 体积 单位 . 1gal 一 3.785 412drni. 


11.5 实验 练习 


(2) 分 别 给 出 1 月 和 :2 月 汽油 价格 的 置信 区 间 (c 一 0. 05); 

(3) 如 何 给 出 1 月 和 2 月 汽油 价格 差 的 置信 区 间 (a 二 0. 05). 

3. 某 校 60 名 学 生 的 一 次 考试 成 绩 如 下 : 

93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 

88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 

75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 

76 90 89 71 66 86 73 80 94 79 78 77 63 53 55 

(1) 作 直 方 图 ,计算 均值 .标准 差 . 极 差 、 偏 度 、 峰 度 ; 

(2) 检验 分 布 的 正 态 性 ， 

4. 设 第 1 题 的 数据 是 机 床 甲 产 生 的 , 另 从 机 床 乙 生产 的 滚珠 中 抽取 10 个 , 测 得 直径 
(单位 : mm) 如 下 : 

15. 2,15. 1,15. 4,14.9,15.3,15.0,15. 2,14. 8,15.7,15.0 
记 两 机 床 生产 的 滚珠 直径 分 别 为 py ;pz ; 试 作 由 三 pa yp 全 py ;1 之 1z 3 种 检验 ， 


表 11.6 100 名 学 生 的 身高 (cm) 和 体重 (kg) 
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5、 甲 方向 乙方 成 批 供 货 , 甲 方 承诺 合格 率 为 90% ,双方 商定 置信 概率 为 95%. 现 从 
一 批 货 中 抽取 50 件 ,43 件 为 合格 品 , 问 乙 方 应 否 接受 这 批 货 物 ? 你 能 为 乙方 不 接受 它 出 
谋划 策 吗 ? 

6. 学 校 随 机 抽取 100 名 学 生 , 测 量 他 们 的 身高 和 体重 ,所 得 数据 如 表 11. 6. 

(1) 对 这 些 数据 给 出 直观 的 图 形 描述 ,检验 分 布 的 正 态 性 ; 

(2) 根据 这 些 数 据 对 全 校 学 生 的 平均 身高 和 体重 做 出 估计 ,并 给 出 估计 的 误差 范围 ; 

(3) 学 校 10 年 前 作 过 普查 ,学生 的 平均 身 离 为 167. 5cm, 平 均 体 重 为 60. 2kg, 根 据 这 
次 抽查 的 数据 ,对 学 生 的 平均 身高 和 体重 有 无 明显 变化 做 出 结论 . 

7. 为 研究 胃 尝 疡 的 病理 医院 作 了 两 组 人 胃液 成 分 的 试验 , 患 胃 演 疡 的 病人 组 与 无 胃 


溃疡 的 对 照 组 各 取 30 人 ,胃液 中 溶菌 酶 含量 如 表 11.7( 溶 菌 酶 是 一 种 能 破坏 某 些 细菌 的 
细胞 壁 的 酶 ). 


(1) 根据 这 些 数 据 判 断 患 骨 省 疡 病人 的 溶菌 酶 含量 与 “正常 人 ”有 无 显著 差别 ; 
(2) 若 表 11.7 患 胃 溃 疡 病人 组 的 最 后 5 个 数据 有 误 ,去 掉 后 再 作 判 断 . 


表 11.7 胃 溃 疡 病人 和 正常 人 { 各 30 人 ) 的 溶菌 酶 含量 


8. 20 名 学 生 参 加 了 某 课程 进行 的 ,考查 同样 知识 的 两 次 测验 ,成 绩 如 表 11. 8. 根据 
这 些 数据 判断 两 次 测验 的 难度 是 否 相 同 . 
表 11.8 20 名 学 生 的 两 次 测验 成 绩 (每 列 是 同一 名 学 生 的 两 次 成 绩 ) 


93 | 85 |79 | 90 |78|76|81|85|88|68|82|73|88|84|90|70|69|83|s3 
88|89|86|85 | 87|88|75 718|86|86|80|89,85 | 79|78|88|88 


EE 


9. 调查 了 339 名 50 岁 以 上 吸烟 习惯 与 患 慢性 气管 炎 的 关系 ,得 表 11. 9. 
表 11.9 豚 烟 习惯 与 患 棍 性 气管 炎 的 人 数 


是 否 忠 病 吸 烟 不 吸烟 总 和 
患 慢性 气管 炎 / 人 43 13 56 
未 患 慢性 气管 炎 / 人 162 121 283 
总 和 /人 205 134 339 


患 病 率 /% 21.0 9.7 16.5 


问 吸烟 者 与 不 吸烟 者 的 慢性 气管 炎 患 病 率 是 否 相 同 . 

10. 表 11. 10 给 出 的 中 国 7~18 岁 青少年 身高 资料 来 源 于 1995 年 全 国学 生体 质 健 
康 调研 ,分 层 随 机 整 群 抽样 自 除 西藏 .台湾 外 的 所 有 省 (市 .自治 区 ) ,年 龄 7 一 22 岁 , 共 约 
20 万 各 年 龄 段 的 数据 . 日 本 7 一 18 岁 青少年 身高 资料 以 1995 年 日 本 学 校 保健 调查 为 依 
据 . 表 11. 10 中 是 各 个 样本 的 均值 和 标准 差 . 设法 用 这 些 数 据 判断 中 国 和 日 本 男女 生 身 高 
是 否 有 差异 . 


表 11.10 1995 年 中 国 和 日 本 男女 生 身 高 资料 单位 : cm 
应 他 | 中国 男生 样本 日 本 男生 样本 中 国 女 生 样本 日 本 女生 样本 
”| 均值 | 标准 差 | 均值 | 标准 差 均值 | 标准 差 | 均值 | 标准 差 
7 124.5 5.7 122.5 5.4 123.4 5.4 121.8 “5.4 
8 129.4 5.6 128. 1 5. 5 128.4 5:5 127.6 5 
9 134.6 | 6.0 133.4 5.4 民生 3 J 6.2 133.5 6.3 
10 139.3 6.6 138.9 5.9 140.0 6.9 140. 2 6.6 
11 145. 1 7.2 144. 9 6:7 146.7 7.0 146.7 6.7 
12 151.2 8.1 152.0 7.8 152.5 人 6. 6 151. 9 6. 2 
13 160.0 8.0 159. 6 7.6 156.3 | 6.0 | 155, 1 5. 4 
14 165. 1】 7.0 165. 1 6.8 157.7 5.3 156.7 5. 2 
15 168.3 6. 3 168. 5 6.2 158. 9 5. 6 157. 4 5.0 
16 170. 1 6. 3 170.0 5.9 159.3 5.4 157.9 5. 3 
17 171.0 [6.0 柱 170.8 6.0 159.3 5.4 158.1 5.0 
18 170.8 5.8 171,.1 5.9 159.1 5.3 158.2 5 
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回归 分 析 


人 们 在 日 常生 活 和 工作 中 常会 遇 到 类 似 于 这 样 的 问题 : 
。 常识 告诉 我 们 ,人 的 年 龄 越 大 血压 越 高 ,那么 平均 说 来 ,60 岁 比 50 岁 的 人 血压 高 
多 少 呢 ? 

。 在 一 定 的 道路 ,环境 条 件 下 ,汽车 刹车 距离 主要 取决 于 车 速 ,怎样 估计 在 一 定 车 速 
下 的 刹车 距离 大 概 在 多 大 的 范围 之 内 ? 
一 家 软件 公司 雇员 的 基本 薪金 既 取 决 于 他 们 的 资历 和 教育 程度 ,也 与 他 们 所 负责 
的 工作 岗位 有 关 , 人 事 总 监 希望 建立 一 个 薪金 与 这 些 因 素 之 间 的 定量 关系 ,从 而 
对 于 新 聘 雇 员 的 底薪 做 到 心中 有 数 ， 

这 样 一 类 问题 有 以 下 的 共同 特点 :人 们 关心 的 那个 数量 ( 因 变 量 ) 受 另 一 个 或 几 个 数 
量 ( 自 变量 ) 的 影响 ,这 种 影响 常常 只 是 关联 性 (而 非 因果 性 ) 的 ,并 用 存 在 着 众多 随机 因 
素 , 难 以 用 机 理 分 析 方 法 找 出 它们 之 间 的 关系 ;人 们 需要 建立 这 些 变量 之 间 的 数学 模型 ， 

使 得 能 够 根据 自 变量 的 数值 预测 因 变 量 的 大 小 ,或 者 解释 因 变 量 的 变化 . 

通常 解决 这 类 问题 大 致 的 方法 .步骤 如 下 : 

(1) 收集 一 组 包含 因 变量 和 自 变量 的 数据 ; | 

(2) 选 定 因 变量 与 自 变 量 之 间 的 模型 , 即 一 个 数学 式 子 ,利用 数据 按照 最 小 二 乘 准则 
计算 模型 中 的 系数 ; 

(3) 利用 统计 分 析 方 法 对 不 同 的 模型 进行 比较 , 找 出 与 数据 拟 合 得 最 好 的 模型 ; 

(4) 判断 得 到 的 模型 是 否 适合 于 这 组 数据 ; 

(5) 利用 模型 对 因 变 量 作出 预测 或 解释 . 

以 上 几 点 是 数理 统计 中 称 为 “回归 分 析 ” 的 主要 内 容 ,这 个 实验 将 从 应 用 的 角度 介 
绍 回 归 分 析 的 基本 原理 .方法 和 软件 实现 ,以 下 12.1 节 是 简化 的 实际 问题 及 其 模型 ， 
12.2 节 和 和 12. 3 节 分 别 介 绍 一 元 和 多 元 线性 回归 分 析 ,12. 4 节 是 非 线 性 回归 分 析 ， 
12. 5 节 布 置 实验 练习 . 
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12.1 实例 及 其 数学 模型 


12.1.1 血压 与 年 龄 


问题 ”为 了 了 解 血 压 随 着 年 龄 的 增长 而 升 高 的 关系 ,调查 了 30 个 成 年 人 的 血压 ( 收 
缩 压 (mmHg)) 如 表 12. 1. 我 们 希望 用 这 组 数据 确定 血压 与 年 龄 ( 岁 ) 的 关系 ,并 且 由 此 从 
年 龄 预测 血压 可 能 的 变化 范围 ,回答 上 面 提出 的 “平均 说 来 60 岁 比 50 岁 的 人 血压 高 多 
少 ” 的 问题 . 


x 表 12.1 30 个 人 的 血压 与 年 龄 
序号 血压 年 龄 序号 血压 年 龄 序号 血压 年 龄 
NE 二 一 
1 144 39 11 162 64 pa 136 36 
2 215 47 12 150 56 22 142 50 
3 138 45 13 140 59 23 120 39 
| J 六 
4 145 47 14 110 34 24 120 21 
J 产 一 一 一 二 一 一 一 一 
5 162 65 15 128 42 25 160 44 
TE SS | 一 =- 一- 
6 142 46 16 130 48 26 158 53 
7 170 67 17 135 45 27 144 | 63 
| 
8 124 42 18 114 18 28 130 29 
Sy 1 
9 158 67 19 116 20 29 125 25 
| | Ww 
10 154 56 20 124 19 | 30 175 69 


模型 ” 记 血 压 ( 因 变量 )y, 年 龄 ( 自 变量 )x, 表 12. 1 的 数据 为 (zi, yi) (i 一 1,2,…， 
30), 用 MATLAB 将 它们 作 图 ,如 图 12. 1, 称 散 


220 =—= 一 
点 图 . 从 图 形 直观 地 看 ,y 与 x 大 致 呈 线 性 关系 ， ,| 
即 y 一 十 Bz, 要 由 数据 确定 系数 色 ,B 的 估计 En | 
值 良 :8 :这 个 问题 可 以 看 作 实验 5 介绍 过 的 曲 站 
线 拟 合 , 即 求 超 定 线性 方程 组 的 最 小 二 乘 解 .但 由 
是 这 个 实验 将 从 统计 推断 的 角度 讨论 品 , 启 的 置 “| 中 区 | 
信 区 间 和 假设 检验 ,进而 对 任意 的 年 龄 = 给 出 y 3 下午 一 一 


的 预测 区 闻 ,属于 一 元 回归 分 析 . 我 们 在 12.2 节 1!0010 一 30 一 30 一 41050 一 60 一 30 


继续 讨论 这 个 问题 ， 图 12.1 血压 与 年 龄 的 散 点 图 
是 二 FM: AR Ed 


人 


0 
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12.1.2 血压 与 年 龄 、 体 重 指数 .吸烟 习惯 


问题 “世界 卫生 组 织 颁布 的 “体重 指数 ”的 定义 是 体重 (kg) 除 以 身高 (m) 的 平方 , 显 
然 它 比 体重 本 身 更 能 反映 人 的 胖 瘦 . 对 表 12. 1 给 出 的 30 个 人 又 测量 了 他 (她 ) 们 的 体重 
指数 ,如 表 12. 2 所 示 . 试 建 立 血 压 与 年 龄 ( 岁 ) 和 体重 指数 之 间 的 模型 , 作 回 归 分 析 . 如 果 
还 记录 了 他 (她 ) 们 的 吸烟 习惯 ( 表 12. 2 中 0 表示 不 吸烟 ,1 表示 上 吸 烟 ) ,怎样 在 模型 中 考 
虑 这 个 因素 ,吸烟 会 使 血压 升 高 吗 ? 对 50 岁 .体重 指数 25 的 吸烟 者 的 血压 作 预 测 ， 


表 12.2 30 个 人 的 血压 与 年 龄 .体重 指数 .吸烟 习惯 


模型 记 血 压 y, 年 龄 之 1 ,体重 指数 TX2 ,吸烟 习惯 X3 ;用 MATLAB 将 多 与 2 的 数据 
作 散 点 图 ,看 出 大 致 也 呈 线 性 关系 ,建立 模型 y== 忆 十 Bxi 十 妨 zxz 十 Bz ,由 数据 估计 系数 久 ， 
Bs 访 ,BB 也 可 看 作曲 线 ( 曲 面 ) 拟 合 ,我 们 将 在 12. 3 节 用 多 元 回归 分 析 继 续 讨论 这 个 问题 . 


12.1.3 软件 开发 人 员 的 薪金 


问题 ”一 家 高 技术 公司 人 事 部 为 研究 软件 开发 人 员 的 薪金 与 他 们 的 资历 .管理 水 平 、 
教育 水 平等 因素 之 间 的 关系 ,要 建立 一 个 数学 模型 , 以便 分 析 公 司 人 事 策 略 的 合理 性 ,并 
作为 新 聘用 人 员 薪 金 的 参考 . 他 们 认为 目前 公司 人 员 的 薪金 总 体 上 是 合理 的 ,可 以 作为 建 
模 的 依据 ,于 是 调查 了 46 名 软件 开发 人 员 的 档案 资料 ,如 表 12. 3, 其 中 资历 一 列 指 从 事 
专业 工作 的 年 数 ,管理 水 平一 列 中 1 表示 管理 人 员 ,0 表示 非 管理 人 员 ,教育 水 平一 列 中 1 
表示 中 学 水 平 ,2 表示 大 学 水 平 ,3 表示 研究 生 水 平 . 


12. 
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表 12.3 软件 开发 人 员 的 划 金 与 他 们 的 资历 .管理 水 平 .教育 水 平 


薪金 /元 | 资历 /年 薪金 /元 管理 水 平 
24 | 22884 6 | 1 2 
25 | 16978 7 1 1 
2 
26 | 14803 8 0 2 
27 | 17404 8 1 1 
28 | 22184 8 1 3 
29 | 13548 8 0 1 
30 | 14467 | 10 0 1 
31 | 15942 | 10 0 2 
32 | 23174 | 10 1 3 
33 | 23780 | 10 1 2 
34 | 25410 | 11 1 2 
35 | 14861 | 11 0 1 
36 | 16882 | 12 0 2 
37 | 24170 | 12 1 3 
38 | 15990 | 13 0 1 
39 | 26330 | 13 1 2 
40 | 17949 | 14 0 2 
41 | 25685 | 15 1 3 
42 | 27837 16 1 2 
十 
43 | 18838 | 16 0 2 
44 | 17483 16 0 1 
22 | 21352 6 1 3 45 | 19207 | 17 0 2 
23 | 13839 6 0 2 46 | 19346 | 20 0 1 


模型 按照 常识 ,薪金 自然 随 着 资历 (年 ) 的 增长 而 增加 ,管理 人 员 的 薪金 应 高 于 非 管 
理 人 员 ,教育 水 平 越 高 薪金 也 越 高 .用 y 表示 薪金 ; 自 变 量 xz) 表示 资历 (年 );x, 二 1 表示 管 
理 人 员 ,xs 二 0 表示 非 管理 人 员 ; 教 育 有 3 个 水 平 , 如 何 处 理 这 个 变量 ,是 建 模 中 的 新 间 


题 . 解决 这 个 问题 的 一 种 办 法 是 定义 
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Hb 1， 中 学 ， 有 1， 大 学 ， 
lo，， 其他; 一 10， 其 他 . 
于 是 中 学 水 平 表 为 x; 二 1, x 二 0, 大 学 水 平 表 为 zx: 二 0，z 二 1, 研究 生 水 平 则 表 为 z; = 
0, X10, 
作为 基本 模型 ,假定 资历 对 薪金 的 作用 是 线性 的 , 即 资历 每 加 一 年 薪金 的 增长 是 常 
数 ;管理 水 平 .教育 水 平 .资历 诸 因 素 之 间 没 有 交互 作用 ,建立 多 元 线性 回归 模型 7 一 十 


Bzi 十 Bxz 十 Bzxs 十 Bx, 这样 做 的 效果 如 何 ,我 们 将 在 12. 3 节 加 以 讨论 . 


12.1.4 酶 促 反应 


问题 ” 酶 是 一 种 高 效 生物 催化 剂 ,催化 条 件 温和 ,经 过 酶 催化 的 化 学 反应 称 为 酶 促 反 
应 . 酶 促 反 应 中 的 反应 速度 主要 取决 于 反应 物 ( 称 为 底 物 ) 的 浓度 ,浓度 较 低 时 反应 速度 大 
致 与 底 物 浓度 成 正比 ( 称 为 一 级 反应 ) ,浓度 较 高 .渐进 饱和 时 反应 速度 趋向 于 常数 ( 称 为 
零 级 反应 ), 二 者 之 间 有 一 过 渡 . 根据 酶 促 反 应 的 这 种 基本 性 质 , 描 述 反 应 速度 与 底 物 浓度 


关系 的 一 类 模型 是 Michaelis-Menten 模型 : 


2 bz 十 这 ? (1) 


其 中 y 是 反应 速度 ,z 是 底 物 浓度 ,Bi ,Bz 为 待定 参数 . 容易 知道 ,PB 是 饱和 浓度 下 的 速度 ， 
称 最 终 反 应 速度 ,而 B 是 达到 最 终 反 应 速度 一 半 时 的 底 物 浓度 , 称 为 半 速 度 点 . 

酶 经 过 阿 哈 霍 素 处 理 , 可 能 会 对 酶 促 反 应 中 反应 速度 与 底 物 浓度 之 间 的 关系 产生 影 
响 ,为 了 研究 这 种 影响 设计 了 两 个 实验 ,一 个 实验 中 所 使 用 的 酶 是 未 经 嗓 叭 霍 素 处 理 的 ， 
另 一 个 实验 的 酶 是 经 过 嗓 叭 霉 素 处 理 的 ,所 得 的 实验 数据 见 表 12. 4. 

表 12.4 酶 促 反 应 实验 中 的 反应 速度 与 底 物 浓度 数据 

底 物 浓度 。 ”0.02 
反应 | 未 名 么 处 理 | 67 | 51 
速度 | 处 理 
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(1) 对 未 经 味 吟 霉 素 处 理 的 酶 促 反应 ,利用 表 12. 4 的 数据 估计 模型 (1) 中 的 参数 
pb， bz; | 

ee 

模型 ”模型 (1) 对 参数 B ,是 非 线 性 的 ,但 是 可 以 通过 下 面 的 变量 代 换 化 为 线性 
模型 


Bt (2) 
模型 (2) 中 的 因 变 量 1/y 对 新 的 


12.2 一 元 线性 回归 分 析 


对 表 12. 4 中 未 经 呀 叭 霉 素 处 理 的 实验 数据 , 画 出 反应 速度 的 倒数 1/y 与 底 物 浓度 的 
倒数 1/z 的 散 点 图 ,并 作 直 线 拟 合 ,得 到 0 ,6 的 估计 值 分 别 为 6.972X 10",0. 215 X 
10 忆 3, 散 点 和 拟 合 的 直线 如 图 12. 2. 可 以 发 现 1/xz 较 小 时 拟 合 较 好 ,1/z 较 大 时 出 现 较 大 
的 分 散 . . 

根据 (2) 式 得 到 B= 二 1/091,ha 二 多 /0 ,从 而 算出 Bi ,Bs 的 估计 值 分 别 为 143. 43 和 
0.0308. 将 ,Be 代 人 原 模型 (1) ,得 到 与 原始 数据 比较 的 拟 合 图 (图 12. 3). 可 以 发 现 ,在 
较 大 时 y 的 计算 值 比 实际 数据 小 ,这 是 因为 在 对 线性 化 模型 作 参 数 估计 时 , 底 物 浓度 x 
较 小 (1/z 较 大 ) 的 数据 在 很 大 程度 上 控制 了 参数 的 确定 ,从 而 使 得 对 底 物 浓度 zx 较 大 数 
据 的 拟 合 , 出 现 较 大 的 偏差 . 

为 了 解决 线性 化 模型 中 拟 合 欠 佳 的 问题 ,需要 直接 考虑 非 线性 模型 (1) ,这 属于 非 线 
性 回归 分 析 ,我 们 将 在 12. 4 节 继 续 讨 论 . 


0.020 一 一 一 一 一 二 200 

0.018 上 上 

0.016 上 150 

0.014 

0.012 上 WD 

0.010 上 s0 

0.008 

| 1 上 1 

0.0060 io0 2030 40 50 60 0 02 04 06 08 10 12 
图 12.2 1/y 与 1/x 的 散 点 图 和 回归 直线 图 12.3 用 线性 化 得 到 的 原始 数据 拟 合 图 


12.2 一 元 线性 回归 分 析 


已 知 一 组 数据 (xi，y;) (i 二 1,2,…,n)， 即 平面 上 的 nn 个 点 ,用 最 小 二 乘 准 则 确定 一 
个 线性 函数 (直线 )y 二 B 十 Bx 的 方法 实验 5 介绍 过 ,为 了 说 明 从 统计 推断 的 角度 有 进 一 
步 讨论 的 必要 ,我 们 看 两 个 例子 . 

例 1 血压 与 年 龄 : 

同 12.1.1 节 ,根据 表 12. 1 的 数据 用 MATLAB 命令 polyfit 得 到 y 二 98. 4084 十 
0. 9732x, 拟 合 结果 如 图 12. 4 所 示 . 

例 2 合金 强度 与 碳 含量 

合金 的 强度 y 与 其 中 的 碳 含量 zx 有 比较 密切 的 关系 , 今 从 生产 中 收集 了 一 批 数据 如 
表 12.5, 从 散 点 图 看 出 二 者 大 致 呈 线 性 关系 ,用 polyfit 可 以 得 到 y 二 27. 9473 十 
131. 8396x, 拟 合 结果 如 图 12. 5 所 示 . 


293 


4 


实验 12 回归 分 析 


表 12.5 合金 的 强度 》 与 其 中 的 碳 含量 


y/kg/mm’ 45.5 | 45.0 | 47.5 | 49.0 | 51.0 | 50.0 | 55.0 | 57.5 | 59.5 
xz/% 0.17 | 0.18 0.22 | 0.24 
220 于 60 
200 
180 

十 
160 eb 50 
+ 
140 插 - | 
120| 忆 NE 45 
本 
100 - 40 
10 20 30 40 50 60 70 0.10 0.12 0.14 0.16 0.18 0.20 0.22 0.24 


图 12.4 血压 与 年 龄 的 拟 合 结果 图 12.5 合金 强度 与 碳 含量 的 拟 合 结果 


虽然 从 上 面 的 计算 看 , 例 1 和 例 2 没有 什么 区 别 , 但 是 只 要 观察 一 下 图 12. 4 和 
图 12. 5 就 可 知道 , 例 2 的 拟 合 效果 比例 1 好 得 多 , 即 按照 所 给 数据 得 到 的 合金 强度 对 碳 
含量 的 依赖 关系 比 血压 对 年 龄 的 依赖 关系 强 得 多 ,于 是 根据 例 2 作 的 预测 和 解释 就 比例 
1 更 为 可 靠 . 显然 ,这 是 由 于 例 2 属于 物理 化 学 ,而 例 1 属于 不 确定 性 因素 更 多 的 生命 科 
学 领域 的 缘故 ， 

怎样 衡量 根据 最 小 二 乘 准则 拟 合 得 到 的 模型 的 可 靠 程 度 ? 怎样 给 出 模型 系数 的 置信 
区 间 和 和 因 变 量 的 预测 区 间 ? 回答 这 些 在 应 用 中 非常 重要 的 问题 ,需要 从 统计 分 析 的 角度 
重新 审视 我 们 研究 的 对 象 . 


12.2.1 一 元 线性 回归 模型 及 其 基本 假设 


如 果 因 变量 y 与 自 变 量 z 之 间 没 有 确定 性 的 函数 关系 ,而 根据 知识 .经 验 或 观察 它 
们 有 一 定 的 关联 性 ,众多 的 .不 可 预测 的 随机 因素 影响 着 它们 之 间 的 关系 ,比如 12.1.1 节 
中 影响 血压 的 一 个 主要 因素 大 概 是 年 龄 ,此 外 还 有 体重 .遗传 .生活 习惯 、. 环 境 等 原因 ,以 
至 于 相同 岁数 的 人 的 血压 并 不 一 样 . 人们 研究 这 类 问题 的 途径 常常 是 收集 一 组 x,y 的 数 
据 , 用 统计 分 析 方 法 建立 一 种 经 验 模型 , 称 为 回归 模型 (12. 2. 6 节 将 对 回归 这 一 名 词 作 简 
单 介绍 ). 下 面 用 数理 统计 的 语言 叙述 一 元 线性 回归 的 假设 条 件 和 要 解决 的 问题 . 
对 于 自 变 量 z 的 每 一 个 值 , 因 变 量 是 一 个 随机 变量 y( 为 简单 起 见 ,随机 变量 和 它 的 
取 值 均 用 y 表示 ). 如 果 工 对 y 的 影响 是 线性 的 ,用 BB, 十 Biz 表示 ,其 中 Bo,B 待定 , 称 回归 
系数 , 除 z 以 外 ,影响 y 的 其 他 随机 因素 的 总 和 用 随机 变量 s 表示 ,于 是 y 可 以 表 为 一 元 
线性 回归 模型 : 
3y 王 反 十 8z 十 s. 《3) 


12.2 一 元 线性 回归 分 析 


一 元 线性 回归 的 基本 假设 有 ， 
(1) 独立 性 ”对 于 不 同 的 z,y 是 相互 独立 的 随机 变量 ; 
(2) 线性 性 y 的 期 望 是 x 的 线性 函数 , 即 By 一 所 十 Pi 
(3) 齐 次 性 ”对 于 不 同 的 x,y 的 方差 是 常数 ; 
(4) 正 态 性 ”对 于 给 定 的 x,y 服从 正 态 分 布 . 
图 12.6 给 出 这 些 假设 的 示意 图 . 根据 (3) 
式 关 于 y 的 这 些 假设 等 价 于 ;e 是 相互 独立 的 
(对 于 不 同 的 x)、 期 望 为 0、 方差 为 常数 ( 记 作 Ba 
o) 、 正 态 分 布 的 随机 变量 , 即 e~N (0, oa?),e 称 
(随机 ) 误 差 . 
对 于 主要 从 应 用 的 角度 学 习 回 归 分 析 的 读 9 加 六 加 x 
者 ,应 注意 这 些 假设 在 什么 情形 下 成 立 ,以 及 如 ”图 12.6 一 元 线性 回归 基本 假设 示意 图 
何 检 验 它们 是 否 成 立 . 以 血压 与 年 龄 问题 为 例 ， 
如 果 z 是 毫 不 相关 的 一 些 人 的 年 龄 ,他 们 的 血压 y 应 是 相互 独立 的 ,但 若 x 是 同一 人 在 
不 同年 代 的 年 龄 ,血压 就 不 会 独立 ;线性 性 是 经 过 对 数据 (或 实际 现象 ) 观 察 后 作 的 假定 ， 
并 且 可 以 通过 对 结果 的 统计 分 析 进 行 检 验 ; 当 影 响 y 的 随机 因素 的 大 小 不 随 r 变化 时 ， 
齐 次 性 通常 成 立 , 它 也 可 由 结果 的 统计 分 析 作 检 验 (需要 很 大 的 数据 量 ) ;按照 概率 论 的 理 
论 , 只 要 随机 因素 众多 , 且 没 有 哪个 起 主要 作用 , 正 态 性 就 大 致 成 立 . 


12.2.2 回归 系数 的 最 小 二 乘 估 计 


假设 对 于 工 的 n 个 值 z;, 得 到 y 的 n 个 相应 的 值 y;(i 二 1,2,…,n), 将 它们 代入 模型 
(3) 式 得 | 


上 


y=PBotBrite: i=1,2,,n, (4) 
其 中 ce: 是 e 的 取 值 ,看 作 相 互 独立 有 旦 与 同 分 布 的 随机 变量 . 根据 最 小 二 乘 准 则 由 x;，y: 
舍 计 回归 系数 B,B;,( 随 机) 误差 平方 和 记 为 Q(Bo ,8 ) , 即 


Qi 一 De = Dy B+B (5) 
利用 极 值 的 必要 条 件 3 所 一 9, 38 一 求 B ,8 的 估计 值 ,得 到 方程 组 
> ys 二 Bx)] = 二 0， Dily — (By + Br)] 一 0. (6) 
记 . 
二 = 过 全 二 人 Ds- —D 


1 一 1 5 一 1 


(7) 


295 


实验 12 回归 分 析 


由 (6) 式 解 出 Bo ,B 的 估计 值 , 记 作 
Bb 一 过， Bo 一 y—pBx. (8) 


可 以 看 出 ,直线 y= 色 十 有 zz 通 过 数据 x;，y; 的 均值 点 (zy). 

因为 样本 yi(i 二 1,2,…,n) 视 为 与 y 同 分 布 的 随机 变量 ,所 以 由 它 算出 的 Bo,B, 也 是 
随机 变量 ,我们 要 估计 的 是 它们 的 总 体 均 值 B&,Bi. Bo ,PB, 称 为 Bo ,Bi 的 最 小 二 乘 估计 ,可 以 
证 明 包 ,BP 是 ,Bi 的 线性 无 偏 最 小 方差 估计 , 即 : Bo ,PB 是 y; 的 线性 函数 (从 (7) 式 和 (8) 
式 看 出 );p ,PB 的 期 望 分 别 等 于 B,,B,( 由 下 面 的 (13) 式 和 (18) 式 给 出 ); 满 足以 上 两 条 的 
称 为 线性 无 偏 估计 ,而 在 所 有 线性 无 偏 估计 中 Po ,B, 是 方差 最 小 的 . 


12.2.3 一 元 线性 回归 的 统计 分 析 


(1) 误差 方差 的 估计 

在 模型 (3) 中 y 由 确定 性 成 分 Bo 十 让 z 和 随机 误差 s 两 部 分 组 成 ,e 的 大 小 由 它 的 方 
差 De 二 =o? 衡量 ,天 越 小 模型 越 有 效 . 怎样 估计 随机 误差 的 方差 呢 ? 在 用 x;, ?计算 出 最 
小 二 乘 估 计 po ,Bi 后 , 令 


:=B th i = 1,2,",n, (9) 
yi 可 以 看 作对 y; 的 理论 值 (期 望 ) 的 估计 .再 由 (4) 式 和 (9) 式 可 得 误差 ;的 估计 和 值 
Ei = yi™— yi 2 一 1,2,'" ,nn. (10) 
Q= De = 了 > (yi — 3)7. (11) 
i=1 1 一 】 


能 否 直 接 用 Q/n 作为 o? 的 估计 呢 ? 由 于 ei(i 二 1,2,…,n) 中 包含 了 2 个 共同 参数 所 Bi si 
不 再 相互 独立 ,致使 Q/n 不 是 a 的 无 偏 估 计 . 可 以 证 明 的 无 偏 和 估计 为 ( 简 记 作 s?) 
Dy Q 
3 一 0 (12) 


n—2’ 
其 中 一 2 是 残 差 平方 和 Q 的 自由 度 , 它 等 于 数据 容量 减 去 模型 中 所 含 参数 的 个 数 . 残 差 
的 方差 称 剩 余 方 差 ( 或 样本 方差 ),s 称 剩余 标准 差 ( 或 样本 标准 差 ). 
(2) 回归 系数 的 区 间 估 计 和 假设 检验 
为 了 得 到 回归 系数 & ,8 的 区 间 估 计 , 需 要 知道 它们 的 分 布 . 可 以 证 明 在 一 元 线性 回 
” 归 的 基本 假设 下 ,名 和 Q 具有 如 下 的 性 质 ， 


Bb! ~ N(B /sh)， . (13) 
Q/c ~ Xb? (14) 

且 pB 和 QQ 相互 独立 .根据 1 分 布 的 定义 由 (12)~(14) 式 可 得 :统计 量 
:一 二) (15) 


MQ/(n — 2)0 
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给 定 显 著 性 水 平 ga,t (nn 一 2) 的 1 一 g/2 分 位 数 为 ,a.1-wz ,Bi 的 置信 区 间 是 
区 一 三 2 1-a/2 大 pb 十 ten-2) ,ia/2 | 
思 由 (16) 式 可 知 , 当 a, 7 一 定时 ,s 越 小 .s;; 越 大 , 则 Bi 的 置信 区 间 越 短 , 即 估计 
的 精度 越 高 . 请 解释 . 
对 于 8 可 以 提出 如 下 假设 检验 : 
Ho:B = 0, Hi:B 天 0， (17) 
若 肪 成立, 表明 自 变 量 z 对 y 没有 影响 ;而 当 拒 绝 五 (接受 电 ,) 时 ,模型 (3) 有 效 . 


可 以 用 :检验 法 检验 Ha 由 (15) 式 当 |1| 一 色光 开 


(16) 


盖 上 ooz 时 拒绝 互 。 实际 


上 ,根据 置信 区 间 (16) 是 否 包 含 零 点 ,也 可 以 检验 及, 是 否 成 立 . 
为 了 得 到 久 的 置信 区 间 需 要 po 的 如 下 性 质 : 


包 ~ N(Rz{( 三 上 + 二))， (18) 


n 


与 上 面 类 似 地 可 得 ,在 显著 性 水 平 a 下 po 的 置信 区 间 为 


> | 并 1 人 | zx? 1 
区 tor2),1~a/2 5 十 i Bo tt toa ,1 a2S Te 书 | (19) 


(3) 模型 的 有 效 性 检验 一 一 决定 系数 和 下 统计 量 
样本 y(ti 二 1,2,…,n) 对 样本 均值 y 的 偏差 y; 一 y 可 以 分 解 为 
yi—y = Cy;— 7) + (ym y). (20) 
上 式 右 端 第 一 项 y; 一 yy; 是 残 差 ,表示 随机 误差 引起 的 因 变 量 的 变化 ,第 二 项 y; 一 y 表示 
自 变量 x 二 =x; 时 引起 的 因 变 量 ( 相 对 于 其 平均 值 ) 的 变化 . 将 (20) 式 两 边 平方 并 求 和 , 得 


到 (可 以 证 明 2) (Cy 一 3) (3; 一 y) = 0) 
i=1 


Dy mH = Dy mH) + Dy — 3)7. (21) 
i=} i=} 二 
记 
S=sy= Oy-WD, U= YY (22) 
i=] i=1 


其 中 S 刻画 因 变 量 总 的 变化 (对 > 而 言 ) , 称 总 偏差 平方 和 ,U 刻画 自 变量 引起 的 因 变 量 
总 的 变化 , 称 回归 平方 和 , 注意 到 (11) 式 残 差 平 方 和 Q 的 定义 ,(21) 式 可 表 为 

SS 一 U 十 QQ. (23) 
即 因 变 量 的 总 变化 量 S 可 分 解 为 自 变量 引起 的 变化 U 和 误差 引起 的 变化 Q 两 部 分 , 显 
然 ,D0 在 S 中 占 的 比重 越 大 ,模型 (3) 越 有 效 . 定义 
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R’: = U/S. (24) 
忆 称 为 决定 系数 ,0<R:<1, 它 表示 在 因 变 量 的 总 变化 量 中 自 变量 引起 的 那 部 分 的 比例 ， 
R’ 越 大 说 明 自 变量 对 因 变 量 起 的 决定 作用 越 大 ,但 是 没有 表明 模型 是 否 有 效 的 明确 的 数 


量 界 限 . 
由 C8) 式 和 (9) 式 容易 知道 (22) 式 中 的 U 可 写作 
U = 久 s, = 衬 . (25) 
于 是 (24) 式 定义 的 决定 系数 又 可 表 为 
天 二 二 (26) 


这 表明 ,如 果 自 变量 x 也 视 为 随机 变量 , 则 决定 系数 Re? 正 是 二 维 随 机 变量 (x,，y) 的 ( 线 
性 ) 相 关系 数 >。 的 平方 ( 见 实验 10). 
为 了 得 到 关于 模型 有 效 性 的 数量 界限 ,需要 构造 合适 的 统计 量 . 当 及 ,成 立时 ,由 
(13) 式 《25) 式 和 x? 分布 的 定义 可 得 
U _ Bs 


了 ls (27) 
有 生 U 和 Q 相互 独立 .于 是 根据 (14) 式 和 下 分 布 的 定义 可 以 选择 F 统计 量 
F=—H— ~ FQ,n-2). (28) 
n—2 


给 定 显著 性 水 平 a,F(1,n 一 2) 的 1 一 a 分 位 数 记 作 Fo.,-w,1-。, 当 由 (28) 式 计算 的 F > 
Fn-2), -时 拒绝 五。 ,否则 接受 Ho. 


12.2.4 利用 一 元 线性 回归 模型 进行 预测 

当 五 被 拒绝 , 即 判断 模型 (3) 有 效 后 ,就 可 从 自 变量 z 的 一 个 给 定 值 xz。 预测 因 变 量 
的 理论 值 yw ,预测 值 实 际 上 是 一 个 (点 ) 估 计 , 记 作 yo. 显然 可 取 

yo = fo 十 Bizo. (29) 

这 里 的 y。 有 如 下 的 统计 意义 :y。 是 无 偏 的 , 即 Ey。 二 yo ,并 且 均 方 误差 ECyo 一 yo)* 最 小 . 

类 似 于 回归 系数 的 区 间 估 计 , 可 以 得 到 给 定 显著 性 水 平 下 的 预测 区 间 (cx=0. 05 时 
yo 有 95% 的 可 能 落 在 此 区 间 ) 为 

a 2 yy | [ ye —\2 

民 本 wenn 于 十 一 十 上 ， yo to ay2s ~ 一 十 一 十 1 


Srr mr 


(30) 
虽然 这 个 结果 比较 复杂 ,但 是 当 很 大 且 x, 接 近 工 时 ,可 以 忽略 (30) 式 根 号 内 的 前 两 项 ， 
且 tw- 近似 于 NC0,1) 的 1 一 a/2 分 位 数 w;-w,， 上 述 预 测 区 间 简 化 为 
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[yo 一 Wi-o/23， yo 士 zwz 5. (31) 
对 于 自 变量 的 任意 值 x, 因 变量 y 的 预测 值 和 预测 区 间 为 
y= 二 Br, [yy 一 SCz),y 十 SCz)]， (32) 
2 
G(zL) = Ra 笃 二 十 二 十 1 、: Ul--a/2 5. (33) 


2 的 预测 区 间 示 意图 如 图 12. 7. 

最 后 指出 ,如 果 因 下 < Fo,,-w,1-s 或 Bi 的 置信 区 间 包 含 零点 而 接受 态 ,, 那 也 只 是 说 
明 > 与 zx 之 间 没 有 合适 的 线性 模型 ,但 是 二 者 之 间 可 能 存在 其 他 关系 ,如 对 散 点 图 12. 8 
的 数据 去 建立 线性 模型 就 大 概 会 接受 态 , ,但 它 明 显 地 显示 了 二 次 函数 关系 . 


y p+60%) .55 
50 tri+H+ 
=PotBrx 二 i | 
+ 
-60) 40|—++ | 
+ + 
35 要 
rt ol | 
300 2 4 6 8 10 
图 12.7 y 的 预测 区 间 示 意图 图 12.8 显示 二 次 函数 关系 的 散 点 图 


12.2.5 一 元 线性 回归 的 MATLAB 实现 
MATLAB 统计 工具 箱 中 用 命令 regress 实现 ,用 法 是 


b= regress(y,X) 
[b,bint,r, rint, s]= regress(y,X,alpha) 


输入 y( 因 变量 , 列 向 量 ) .X(1 与 自 变量 组 成 的 矩阵 , 见 下 面 的 程序 ) ,alpha 是 显著 性 
水 平 a( 默 认 时 设 定 为 0.05). 

输出 b=(B& ,名 ) ,注意 :b 中 元 素 顺序 与 polyfit 的 输出 相反 ,bint 是 B。,p, 的 置信 区 
间 ,r 是 残 差 ( 列 向 量 ) ,rint 是 残 差 的 置信 区 间 ,s 包含 4 个 统计 量 : 第 1 个 是 决定 系数 R 
(24) 式 ) ;第 2 个 是 下 值 ((28) 式 ) ;第 3 个 是 下 (1,n 一 2) 分 布 大 于 下 值 的 概率 p ,p<a 时 
拒绝 百 , ,回归 模 型 有 效 ; 第 4 个 是 ? (剩余 方差 )@ 

对 本 节 例 1 和 例 2 可 编制 如 下 程序 ; 

y=[...j]; % 已 知 的 因 变 量 数组 

x=[...j; % 已 知 的 自 变量 数组 


@ MATLAB 7.0 以 前 版 本 没有 第 4 个 统计 量 ,s? 可 由 程序 sum《r."2)/(n 一 2) 计 算 . 
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Ns % 已 知 的 数据 容量 
X= [ones(n,1) ,x"]; % 1 与 自 变 量 组 成 的 输入 矩阵 
[b, bint,r, rint,s| = regress(y', X); % 回归 分 析 程 序 (a ==0.05) 
b ,bint,s， % 输出 回归 系数 及 其 置信 区 间 和 统计 量 
rcoplotCr, rint) % 残 差 及 其 置信 区 间作 图 
例 1 计算 得 到 


b = 98.4084 0.9732 
bint = 78.7484 118.0683 
0.5601 1.3864 
s= 0.4540 23.2834 0.0000 273.7137 


这 个 结果 可 整理 如 表 12. 6. 
表 12.6 例 1( 血 压 与 年 龄 ) 的 计算 结果 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
bo 98. 4084 [78.7484 118.0683] 
有 0. 9732 [0. 5601 1.3864] 


R’=0.4540 F=23.2834 p<0.0001 时 一 273.7137 


可 知 记 ,Bi 与 polyfit 计算 的 结果 相同 . 

从 几 个 方面 都 可 检验 模型 是 有 效 的 :8 的 置信 区 间 不 含 零点 ;Pp 过 a; 用 MATLAB 命 
令 finv(0.95,1,n 一 2) 计 算得 到 Fu ,= 4.1960<F. 但 是 B 的 置信 区 间 较 长 ,R? 较 
小 ,说 明 模 型 精度 不 高 . 

残 差 及 其 置信 区 间 如 图 12.9, 图 中 第 2 个 点 (x;，yz) 残 差 的 置信 区 间 不 包含 零点 ， 
可 以 认为 这 个 数据 是 异常 的 ( 残 差 应 服从 均值 为 0 的 正 态 分 布 ) , 它 偏离 数据 整体 的 变化 
趋势 ,给 模型 的 有 效 性 和 精度 带 来 不 利 影响 , 称 异 常 点 或 离 群 点 ,应 予以 剔除 ， 

将 原始 数据 中 的 第 2 个 剔除 后 重新 计算 得 到 表 12. 7. 


表 12.7 例 1 剔 除 第 2 个 数据 后 的 计算 结果 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
Bo 96. 8665 [85. 4771 108.2559] 
A 0. 9533 [0.7140 1.1925] 


R= 0.7123 下 一 66.8358 p<<0.0001 s*=91.4305 


可 以 看 出 色 ,Bi 变化 不 大 ,但 置信 区 间 变 短 ,R* 和 下 变 大 ,s 减 小 ,说 明 模 型 精度 提高 . 残 
差 及 其 置信 区 间 见 图 12. 10. 从 图 12. 10 又 发 现 2 个 新 的 异常 点 (为 什么 会 出 现 ?), 剔 除 
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它们 后 模型 会 有 什么 改进 ,请 读者 试验 . 
Residual Case Order Plot Residual Case Order Plot 


Residuals 
hhD 
SO 
Residuals 


ee 1. 1 Fs Te 1 
20 25 30 5 10 15 20 25 
Case Number Case Number 


图 12.9 例 1 的 残 差 及 其 置信 和 区间 图 12.10 例 1 吻 除 (x,,y) 的 残 差 及 其 置信 区 间 


1_ 1 1 
5 10 15 


将 上 面 得 到 的 回归 系数 的 估计 值 久 二 96. 8665,P 二 0.9533 代入 (29) 式 ,对 50 岁 
(zo 一 50) 人 的 血压 进行 预测 ,得 yo。 二 144. 5298, 在 a 二 0.05 下 按照 (30) 式 计算 的 预测 区 
间 为 [C124. 5406 ,164. 5190] ,按照 简化 的 (31) 式 计算 的 预测 区 间 为 [125.7887,163. 2708]. 
例 2 的 计算 结果 如 表 12. 8. 
表 12.8 例 2{( 合 金 强度 与 碳 含 量 ) 的 计算 结果 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
pbo 27.9473 [25.7205 30.1741] 
Bi | 131. 8396 [118. 3788 145., 3005] 


R’=0.9794 F=476.2462 p<0.0001 =0.7737 


显然 这 个 结果 不 仅 能 通过 模型 有 效 性 检验 ,而 且 可 以 知道 模型 的 精度 比例 1 高 . 另 
外 ,和 残 差 及 其 置信 区 间 图 也 显示 存在 异常 点 ,剔除 后 模型 还 会 有 改进 ,请 读者 试验 . 


12.2.6 “回归 ”一 词 的 来 历 


回归 (regression) 是 英国 著名 遗传 学 家 Francis Golton (1822 一 1911) 引入 的 ,他 在 研 
究 家 族 成 员 的 相似 性 时 发 现 :虽然 一 般 说 来 高 个 子 的 父 代 会 有 高 个 子 的 子 代 ,但 是 子 代 的 
身高 比 他 们 的 父 代 更 加 趋向 一 致 , 即 若 父 代 身材 高 大 , 则 他 们 的 子 代 会 趋向 矮 一 些 , 而 若 
父 代 身材 矮小 , 则 他 们 的 子 代 会 趋向 高 一 些 . 他 把 子 代 的 身高 向 平均 值 靠拢 的 趋势 称 为 
“向 平庸 的 回归 ”. 这 种 看 法 可 由 Golton 的 门徒 Karl Pearson(1857 一 1936) 的 一 项 统计 工 
作 说 明 . 

Pearson 测量 了 1078 个 父亲 和 他 们 的 儿子 的 身高 , 散 点 图 如 图 12. 11. 记 父 亲 的 身高 
为 zx, 儿子 的 身高 为 y, 单 位 是 in(lin==2, 54cm), 由 这 些 数据 得 到 : 


本 
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ee 
78r i 
1 1 1 1 这 
76 四 ko 
74 上 .1 1 ， Ee 4 
a i 
二 1 把 志 
70 上 机 人 
时 68 Ft- 
和 i 
< . 
人 A | 
1 
1 1 1 1 
6 本 1 1 
LE i | ist PN i RE A MS ES WX 
58 60 62 64 66 68 70 72 74 76 78 80 


父亲 的 身高 /in 
图 12. 11 1078 个 父亲 和 儿子 身高 的 散 点 图 


(1) zs68,ys:69 ,儿子 比 父亲 平均 高 约 lin, 图 中 用 45" 角 的 虚线 表示 这 个 关系 ; 

(2) 对 于 身高 72in 的 父亲 (图 中 用 zx=71.5 和 72.5 的 两 条 竖 直 虚线 之 间 的 点 表 
示 ) ,儿子 的 身高 多 数 不 到 73in( 上 述 两 条 虚线 间 的 点 ,多 数 在 45 虚线 之 下 ) ,平均 身高 
约 71in; 

(3) 对 于 身高 64in 的 父亲 (图 中 用 x 二 63.5 和 64.5 的 两 条 竖 直 虚线 之 间 的 点 形 
示 ) ,儿子 的 身高 多 数 超过 65in( 上 述 两 条 虚线 间 的 点 ,多 数 在 45 虚线 之 上 ) ,平均 身高 
约 67in; 

(4) z，y 之 间 的 回归 直线 (图 中 实 线 ) 是 y==0. 516z 十 33. 73. 
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如 果 人 们 根据 知识 .经 验 或 者 观察 等 认为 与 因 变 量 y 有 关联 性 的 自 变量 不 止 一 个 ， 
那么 就 应 该 用 最 小 二 乘 准则 建立 多 元 线性 回归 模型 . 
设 影响 因 变 量 y 的 主要 因素 ( 自 变量 ) 有 mr 个 , 记 工 二 (zi，… ,zs), 其 他 随机 因素 的 
总 和 仍 用 随机 变量 s 表示 ,假定 一 元 线性 回归 的 4 条 基本 假设 可 以 推广 到 多 元 , 则 多 元 线 
性 回归 模型 可 记 作 
| = pb 二 Bx 村 让 十 se， (34) 
e~ N(0,0). 


12.3 多 元 线性 回归 分 析 


12.3.1 回归 系数 的 最 小 二 乘 估计 


现 得 到 个 独立 观测 数据 (2 ;za ，… zm) (i 二 1,… ,n,n 之 m) ,由 (34) 式 得 
必 = BBrat thr te 
ei:~ N(0,0), i= 1,",n. 


1 1 El 
: : ; ， 一 : |， ee= :| p= [8 ,8 ,BY. (36) 
1 Tnl je Ton Vn Ey 


(35) 式 表示 为 


记 


Se 


Y XpB 十 e 9 
| ~ N(0,o1). 
为 了 根据 最 小 二 乘 准 则 估计 模型 (34) 中 的 参数 8 ,由 (37) 式 这 组 数据 的 误差 平方 
和 为 


(37) 


Q(B) = ye = 一 2p)rG 一 邯 )， (38) 
利用 极 值 的 必要 条 件 38 一 0 Gj 一 0,1,…,m) , 求 8 使 Q(B) 最 小 ,得 到 方程 组 
X'(Y— 事 )=(. (39) 
该 方程 组 的 解 
B= (XX) XY (40) 


称 为 8 的 最 小 二 乘 估计 . 与 一 元 线性 回归 一 样 ,A 是 8 的 线性 无 偏 最 小 方差 估计 . 

思考 说明 ; m==1 时 (40) 式 的 结果 与 (8) 式 相同 ;X 具有 什么 性 质 XTX 才 可 北 ; 实 
际 问题 中 怎样 保证 发 具有 这 种 性 质 ;z>>mm 的 要 求 为 什么 是 必要 的 

”如 果 将 数据 先 “ 中 心 化 ”, 即 令 zi 二 zj 一 zj) ,yi 二 yi 一 y》, 这 里 工 ) 是 zy，… ,zw 的 均值 
C=] ,1m) yy 是 yy 9 的 均值 , 且 记 


之 11 Tn 1 
芝 二 : : | Y = | B= [ph,.,p,]. (41) 
Tl EE I J yy 
则 与 (35) 一 (40) 式 等 价 的 结果 是 
B= (TY， = 一 Bz 十 十 避 工 ,). (42) 
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12.3.2 多 元 线性 回归 的 统计 分 析 


一 元 线性 回归 统计 分 析 的 结果 都 可 推广 到 多 元 线性 回归 . 
(1) 误差 方差 的 估计 
将 BB 代 回 模型 (34) 得 到 y 的 估计 值 


y 一 十 zi 十 … 十 Brv， (43) 
残 差 “及 残 差 平方 和 Q 的 定义 仍 为 (10) 式 和 (11) 式 ,而 剩余 方差 (于 的 无 偏 估计 ) 为 
2 Q 
3 二 0 二 (44) 


因为 模型 中 参数 的 个 数 为 m 十 1, 所 以 Q 的 自由 度 是 一 Cm 十 1). 
(2) 回归 系数 8 的 区 间 估 计 和 假设 检验 
可 以 证 明 在 多 元 线性 回归 的 基本 假设 下 ,8 和 Q 具有 如 下 的 性 质 : 
B; ~ NBsacy), j= 1,,m, (45) 
Q/o” ~ Xn—m—1), (46) 
且 8 和 Q 相互 独立 ,其 中 cy 是 矩阵 (X7 序 ) -的 第 7 对 角 元 素 . 根据 上 分 布 的 定义 由 (44) 一 
(46) 式 可 得 上 统计 量 


(BP) /eye BB yi dy 2 
VO/ mle sv 
给 定 显著 性 水 平 cz (n 一 2) 的 1 一 a/2 分 位 数 为 ko, iv 有 的 置信 区 间 二 1,…,m) 是 


不 一 


[8; — to wos Vcss Bb; 十 toa-a2s Mey (48) 
与 一 元 线性 回归 类 似 地 提出 如 下 m 个 假设 检验 (j= 二 1,…,m): 
HE :Bb; 一 0， HY :8 天 0. (49) 


用 上 检验 法 检验 互 :由 (47) 式 当 

a 

时 拒绝 五 凡 . 根据 置信 区 间 (48) 是 否 包 含 零点 ,也 可 以 检验 五 凡 是 否 成 立 . 
BB 的 置信 区 间 为 


区 — tenans fr RTI) E+ 二， Brew ws a ET RE | (51) 


其 中 x 二 (zi, ,zm)， 

(3) 模型 的 有 效 性 检验 一 一 决定 系数 和 下 统计 量 

与 一 元 线性 回归 相同 ,总 偏差 平方 和 S 可 以 分 解 为 回归 平方 和 UL 与 残 差 平方 和 Q 之 
和 ,决定 系数 R? 的 定义 也 完全 与 (22) 式 ~(24) 式 一 样 , 它 表 示 在 因 变 量 的 总 变化 量 中 由 
自 变量 决定 的 那 部 分 的 比例 . 


[#1|= 


> te-2) 1a/2 (50) 


12.3 多 元 线性 回归 分 析 


作为 模型 整体 的 有 效 性 检验 ,提出 假设 检验 


HosB 一 及 一 … 一 6 一 0. (52) 
可 以 证 明 当 五。 成 立时 
U/g’ ~ Ym), (53) 
且 U 和 Q 相互 独立 .于 是 根据 (47) 式 和 下 分 布 的 定义 可 以 选择 下 统计 量 
P= Fy ~ Fomn—m—1). (54) 
给 定 显著 性 水 平 z,Flm, n 一 m 一 1) 的 1 一 a 分 位 数 记 作 情 ,-。-b.1-o， 当 由 (54) 式 计算 


的 F>>Fo,n-o-b'i-e 时 拒绝 五 。, 模 型 (34) 整 体 有 效 , 但 不 排除 有 若干 个 房 二 0( 可 由 假设 
检验 (49) 解 决 ). 


12.3.3 利用 多 元 线性 回归 模型 进行 预测 


当 模型 (34) 通 过 有 效 性 检验 后 ,可 由 自 变量 的 任 一 给 定 值 x*=(zl,，…，,zn) 预 测 因 变 
量 的 理论 值 y, 记 作 ,显然 
> 一遍 十 和 zi 士 … 士 包 zw (55) 
与 一 元 线性 回归 一 样 ,y 是 无 偏 的 ,并 且 均 方 误差 EC(y 一 y)? 最 小 . 
在 给 定 显著 性 水 平 < 下 y 的 预测 区 间 为 


[7 — 80) ,9+ O00)], Ox) 一 trourowasA/ 一 下 T( 训 雄一 站 十 二 十 1 
(56) 


当 ? 很 大 且 x* 接近 x 时 ,上 述 预测 区 间 简 化 为 
[Ly Ui-a/25, y 十 toz sj]. (57) 


12.3.4 多 元 线性 回归 的 MATLAB 实现 


仍然 用 命令 regress(y,X) ,只 需 注意 输入 矩阵 X 的 构成 恰 如 (36)? 式 定义 的 疏 , 如 对 
12. 1.2 节 血 压 与 年 龄 .体重 指数 、 吸 烟 习 惯 ,编制 如 下 程序 : 


y=[ % 已 知 的 因 变 量 数组 (血压 ) 
x1=[...] % 已 知 的 自 变 量 数 组 (年 龄 ) 
x2=[...]; % 已 知 的 自 变量 数组 (体重 指数 ) 
x3=[...]; % 已 知 的 自 变 量 数组 ( 极 烟 习惯 ) 
n= 30; % 数据 容量 

m= 3; % 自 变量 个 数 

X= [ones(n,1),x1',x2',x3"]; % 输入 矩阵 

[b,bint,r,rint,s]= regress(y', X); % 回归 分 析 程 序 («=0.05) 


b,bint,s, % 输出 回归 系数 及 其 置信 区 间 和 统计 量 
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计算 得 到 的 结果 如 表 12. 9. 
表 12.9 12.1.2 节 的 计算 结果 


回归 系数 回归 系数 合计 和 值 回归 系数 置信 区 间 
Bo 45. 3636 [3.5537 87.1736] 
有 0. 3604 [一 0.0758 0.7965 ] 
3. 0906、 [1.0530 5.1281] 
bs 11. 8246 | [一 0.1482 23.7973] 


R= 0.6855 F= 18.8906 p<0.0001 #*=169.7917 


从 残 差 及 其 置信 区 间 的 图 发 现 第 2 和 第 10 个 点 为 异常 点 ,剔除 它们 重新 计算 得 到 
表 12. 10. 


表 12.10 12.1.2 节 剔除 第 2 和 第 10 个 数据 后 的 计算 结果 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
[ex 58. 5101 [29.9064 87.1138] 
a 0. 4303 [90. 1273 0.7332] 
2. 3449 [o. 8509 3.8389] 
8, 10. 3065 | .3878 17.2253] 


及: 一 0.8462 下 一 44.0087 p<0.0001 s=53.6604 


由 它 得 到 的 预测 模型 为 y= 二 58. 5101 十 0. 4303zi 十 2. 3449xs 十 10. 3065z;. 

由 这 个 结果 可 知 ,年 龄 和 体重 指数 相同 的 人 ,吸烟 者 比 不 吸烟 者 的 血压 (平均 ) 高 
10. 3. 另外 ,这 里 8; 二 0.4303( 即 年 龄 增加 1 岁 血 压 升 高 0.43) ,而 例 1 中 BB 二 0.9533, 你 
能 解释 为 何 有 这 么 大 的 差别 吗 ? : 

对 50 岁 .体重 指数 25 的 吸烟 者 的 血压 作 预 测 : 将 z= 二 50,zxs 二 25,z; 二 1 代入 上 面 
的 预测 模型 得 y 二 148. 9525 ,在 a 二 0.05 下 按照 (56) 式 计算 的 预测 区 间 为 [133. 1716， 
164.7334], 按 照 简化 的 (57) 式 计算 的 预测 区 间 为 [134. 5951, 163. 3099]. 


12.3.5 ”线性 最 小 二 乘 拟 合 与 多 元 线性 回归 的 一 般 形式 
上 面 关于 线性 最 小 二 乘 拟 合 及 一 元 和 多 元 线性 回归 的 论述 中 , 因 变 量 y 都 是 自 变量 
或 x 二 (x ,… ,zm) 的 线性 函数 ,虽然 这 里 "元 ” 指 的 是 自 变量 x, 但 是 线性 最 小 二 乘 拟 合 


与 线性 回归 中 的 “线性 ”并 非 指 y 与 x 的 关系 ,而 是 指 y 是 系数 Bo,PB 或 B= (BB， 
Bl，… ,Bw ) 的 线性 函数 ( 见 (3) 式 和 (34) 式 ). 当 且 仅 当 > 对 系数 8 是 线性 的 ,按照 最 小 二 乘 
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准则 得 到 的 .求解 8 的 方程 就 一 定 是 线性 方程 ( 见 (6) 式 和 (39) 式 ). 
拟 合 如 ?一遍 十 By 一 风 十 en 十 /zs 的 函数 仍然 是 线性 最 小 二 乘 拟 合 或 线性 加 
归 ; 若 拟 合 如 > 一 & ef 的 曲线 ,虽然 y 对 系数 所, 是 非 线 性 的 ,但 是 取 对 数 后 in y 对 系 
数 po,p 仍 是 线性 的 ,属于 可 化 为 线性 回归 的 类 型 . 本 质 上 的 非 线性 回归 将 在 12. 4 节 
介绍 . 
线性 最 小 二 乘 拟 合 与 多 元 线性 回归 的 一 般 形式 可 写作 
[y=B tari(n) + tpra (x) 十 e， 
le ~ N(0,0). 
其 中 x= (zzosriCr) (三 1,…,m) 是 已 知 函 数 . 显然 ,只 需 用 变量 代 换 将 xj Cx) 化 为 
新 的 变量 ,(58) 式 就 与 前 面 讨论 的 模型 (34) 完 全 一 样 . 


12.3.6 多 元 线性 回归 中 的 交互 作用 


我 们 通过 12. 1. 3 节 关 于 软件 开发 人 员 的 薪金 问题 说 明 如 何 发 现 交 互 作用 的 存在 ,和 
怎样 处 理 交互 作用 以 改进 模型 . 
对 于 12.1.3 节 的 模型 
> 一 所 十 Br 十 Br 十 zs 十 pz 十 e， (59) 
用 MATLAB 统计 工具 箱 的 命令 regress 计算 ,得 到 回归 系数 及 其 置信 区 间 、 统 计量 R?， 
下 ,Pp 及 s*(o 的 无 偏 估计 ) 的 结果 (显著 性 水 平 a 二 0.05), 见 表 12. 11. 


表 12.11 12.1.3 节 的 计算 结果 


(58) 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
| he ee ed 
Bb 11033 [10258 11807] 
| es 
Bb 546 [484 608] 
Bb 6883 [6248 7517] 
Bs 一 2994 [一 3826 ”一 2162] 
B, 148 [一 636 931] 


及 :一 0. 9567 F=226.4258 p<0.0001 s:=1.0571 X10 


表 中 各 个 回归 系数 的 含义 可 初步 解释 如 下 :zi 的 系数 说 明 ,资历 增加 1 年 薪金 增长 
546;zsz 的 系数 说 明 ,管理 人 员 的 薪金 比 非 管理 人 员 多 6883; zs 的 系数 说 明 .中 学 程度 的 薪 
金 比 研究 生 少 2994; zx 的 系数 说 明 ,大 学 程度 的 薪金 比 研 究 生 多 148 ,但 是 应 该 注意 到 
的 置信 区 间 包 含 零 点 ,所 以 这 个 系数 的 解释 是 不 可 靠 的 . 当然 这 些 解 释 是 就 平均 值 而 言 ， 
并 且 某 一 个 自 变量 改变 引起 的 因 变 量 的 变化 量 ,都 是 在 其 他 自 变 量 不 变 的 条 件 下 才 成 
立 的 . 
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从 结果 看 ,R: 一 0.9567, 即 因 变 量 ( 薪 金 ) 总 变化 量 的 约 96% 可 由 自 变量 确定 , p 远 小 
于 c, 因 而 模型 从 整体 来 看 是 有 效 的 . 但 是 由 于 ,的 置信 区 间 包 含 零点 ,应 接受 AR,=0 的 假 
设 检 验 ,这 样 就 要 排除 教育 水 平 对 薪金 的 影响 ,显然 不 够 合理 ,需要 对 模型 (59) 作 改进 . 

(1) 用 残 差分 析 发 现 交 互 作用 

为 寻找 改进 的 方向 常用 残 差分 析 方 法 ,这 里 残 差 ei 二 6; 二 yi 一 yi;(i 二 1,…,n) 由 
MATLAB 输出 中 的 r( 向 量 ) 给 出 . 因为 在 线性 回归 的 基本 假设 se 一 N (0, o?) 下 ,如 果 模 
型 (59) 合 适 , 残 差 e 应 大 致 服从 N (0,c:). 所 谓 残 差分 析 , 就 是 观察 e 是 否 服 从 N (0,0?) 
( 当 自 变 量 一 定时 ) ,着 否 , 则 应 设法 改进 模型 . 

为 了 分 析 残 差 与 诸 自 变量 之 间 的 关系 ,将 自 变量 分 成 资历 zi 与 管理 -教育 水 平 组 
合 rz 一 习 两 类 ,2 个 管理 水 平和 3 个 教育 水 平 组 合成 管理 -教育 的 6 个 水 平 ,其 定义 如 
表 12. 12. 然后 画 出 与 资历 z 的 散 点 图 (图 12.12), 及 e 与 管理 -教育 组 合 xs 一 z 的 散 
点 图 (图 12. 13). 

表 12.12 管理 -教育 水 平 组 合 

管理 水 平 0 1 0 1 0 1 
教育 水 平 1 
组 合 水 平 


从 图 12.12 看 , 残 差 虽 然 大 致 上 均值 为 0、 方 差 为 常数 ,但 明显 地 分 布 在 3 个 区 域 ,不 
是 正 态 分 布 ;从 图 12. 13 看 ,对 于 管理 -教育 组 合 的 前 4 个 水 平 , 残 差 或 者 全 为 正 , 或 者 全 
为 负 , 均 值 明 显 不 为 0, 更 是 远离 正 态 分 布 . 以 上 现象 表明 管理 -教育 组 合 在 模型 中 处 理 不 
当 , 这 是 由 于 6 个 水 平 的 管理 -教育 组 合 混在 一 起 ,在 模型 中 未 被 正确 反映 的 结果 . 


000 一 一 一 一 二 二 二 -一 = 一 = 
+ 
1000 主 = 
0 上 
-1000 上 
1 1 1 上 
20000 5 10 15 20 人 1 2 3 4 5 6 
图 12.12 模型 ($9)e 与 xi 的 散 点 图 图 12.13 模型 (59)je 与 组 合 x: 一 六 的 散 点 图 


模型 (59) 中 管理 水 平和 教育 水 平 是 分 别 起 作用 的 ,而 实际 上 ,二 者 可 能 起 着 交互 作 
用 ,如 大 学 水 平 的 管理 人 员 的 薪金 的 增加 (与 中 学 水 平 的 非 管理 人 员 相 比 ) ,会 比 大 学 水 平 
薪金 的 增加 (与 中 学 水 平 相 比 ) 与 管理 人 员 薪 金 的 增加 (与 非 管 理 人 员 相 比 ) 之 和 高 一 点 . 

以 上 分 析 提 示 我 们 ,应 在 基本 模型 (59) 中 增加 管理 水 平 z: 与 教育 水 平 x3, Xx; 的 交互 
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项 ,建立 新 的 回归 模型 . 
(2) 增加 交互 作用 的 模型 
增加 zx 与 x;， xz 之 间 最 简单 的 交互 项 -一 一 乘积 项 ,模型 可 记 作 
y=Bo 二 Brtthrs thr ti Br tbrra tt berors 十 <s. (60) 
这 仍 是 多 元 线性 回归 模型 .利用 MATLAB 的 统计 工具 箱 计算 得 到 的 结果 如 表 12. 13. 


表 12.13 模型 {60) 的 计算 结果 


回归 系数 回归 系数 估计 值 。 回归 系数 置信 区 间 
pb 11204 [11044 11363] 
有 497 [486 508] 
= 人 

应 7048 [£6841 7255] 
a 一 1727 [一 1939 一 1514] | 

Be 一 348 | [一 545 一 153] 

Bs | 一 93071 [ 上 一 3372 一 2769] 

1836 1 [1571 2101] 


R?=0.9988 F=554.48 p<0.0001 ¥=3.0047X10! 


可 知 模型 (60) 的 R? ,下 值 和 s’ 都 比 模型 (59) 有 所 改进 ,并 且 所 有 回归 系数 的 置信 区 
间 都 不 含 零点 ,表明 模型 (60) 是 完全 有 效 的 . 

与 模型 (59) 类 似 , 作 模 型 (60) 的 两 个 残 差分 析 图 (图 12. 14、 图 12.15), 可 以 着 出 ,已 
经 消除 了 图 12. 12、 图 12. 13 中 的 不 正常 现象 ,这 也 说 明了 模型 (60) 的 适用 性 . 


500 -一 一 500 
举 
十 十 本 + + 下 志 填 志 
尘 十 二 十 丰 
ol 于 下 of 4 # 
-500 -500 
-1000 一 有 [000 二 二 
0 5 10 15 20 1 2 a 4 5 6 
图 12.14 模型 (60)e 与 x; 的 散 点 图 图 12,15 模型 (60)e 与 组 合 x*: 一 x 的 散 点 图 


从 图 12. 14 .图 12. 15 还 可 以 发 现 -一 个 异常 点 ;具有 10 年 资历 .大 学 程度 的 那 位 管理 
人 员 的 实际 薪金 明显 地 低 于 模型 的 估计 值 . 从 表 12. 3 查 出 他 是 33 号 ,这 可 能 是 由 我 们 未 
知 的 原因 造成 的 . 用 MATLAB 命令 rcoplot(r,rint) 作 图 ,也 可 以 发 现 这 个 异常 点 . 
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将 这 个 异常 点 去 掉 , 对 模型 (60) 重 新 估计 回归 系数 ,得 到 的 结果 如 表 12. 14, 残 差分 
析 图 见 图 12.16、 图 12.17. 可 以 看 出 ,去 掉 异常 点 后 结果 又 有 改善 . 


表 12.14 模型 (60) 去 掉 异 常 点 后 的 计算 结果 


回归 系数 估计 值 回归 系数 置信 区 间 


En 
有 498 [494 503] 
BB [6962 7120] 
Bs [一 1818 一 1656] 
Bh [一 431 一 281] 
bs [一 3171 一 2942] 
bs [1894 2100] 
R’=0.9998 F=36701 p<0.0001 $=4.3474X10’ 
200 200 
Wo sy 四 100 有 
下 + :ii 
| -3 
—100 汪汪 十 —100 + 
0 5 16 5 20 和 0 2 3 4 5 6 
图 12. 16 模型 (60) 去 掉 异 常 点 后 e 图 12. 17 模型 (60) 去 掉 异常 点 后 e 
与 的 散 点 图 与 组 会 xz 一 x4 的 散 点 图 


作为 这 个 模型 的 应 用 之 一 ,不 妨 用 它 来 “制订 ”管理 - 教育 组 合 6 个 水 平 人 员 的 “基础 ” 
薪金 ( 即 资历 为 零 的 薪金 ,当然 ,这 也 是 平均 意义 上 的 ). 利用 模型 (60) 和 表 12. 14 可 以 得 


到 表 12. 15. 
表 12.15 管理 -教育 组 合 6 个 水 平 人 员 的 "基础 "薪金 
组 合 水 平 管理 水 平 教育 水 平 系 数 “基础 "薪金 

1 0 1 RB 二 Bs 9463 
2 1 1 PB tp 十 BB +pB; 13448 
3 0 2 B+B, 10844 
4 1 2 B 十 Bz 十 Bi 十 Bs 19882 

0 3 bo 11200 
6 1 3 B+pB 18241 
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可 以 看 出 ,大 学 水 平 的 管理 人 员 的 薪金 比 研 究 生 水 平 的 管理 人 员 的 薪金 高 ,而 大 学 水 
平 的 非 管 理 人 员 的 薪金 比 研究 生 水 平 的 非 管理 人 员 的 薪金 略 低 . 当然 ,这 是 根据 这 家 公司 
实际 数据 建立 的 模型 得 到 的 结果 ,并 不 具 普 遍 性 . 


12.3.7 多 项 式 回归 


多 项 式 回归 仍然 属于 多 元 线性 回归 ,我 们 通过 实例 说 明 什么 时 候 会 用 到 多 项 式 回 归 ， 
以 及 MATLAB 软件 处 理 它 时 有 什么 特别 的 地 方 . 

' 例 3 西红柿 的 施肥 量 与 产量 

为 了 研究 西红柿 的 施肥 量 对 产量 的 影响 ,科研 人 员 对 14 块 大 小 一 样 的 土地 施加 不 同 
数量 的 肥料 ,收获 时 记录 西红柿 的 产量 ,并 在 整个 耕作 过 程 中 尽量 保持 其 他 条 件 相 同 , 得 
到 的 结果 如 表 12. 16, 建立 施肥 量 与 产量 关系 的 回归 模型 ,使 之 能 从 施肥 量 对 西红柿 的 产 
量 作 出 预报 ， 


表 12.16 14 块 土地 西红柿 的 施肥 量 和 产量 


” ”地 块 序号 产量 /L 施肥 量 /kg 地 块 序号 产量 /L 施肥 量 /kg 
1 1035 6.0 8 960 11.5 
2 624 2.5 9 990 5.5 
3 1084 7.5 10 1050 6.5 
一 一 
4 1052 8.5 11 839 4. 0 
5 1015 10.0 12 1030 9.0 
6 66 | 7.0 13 985 11.0 
7 704 3.0 下 855 | 12.5 
模型 的 建立 和 求解 


首先 以 施肥 量 为 自 变量 zx, 产量 为 因 变 量 y; 画 出 所 给 数据 的 散 点 图 ,如 图 12. 18. 可 
以 看 出 , 随 着 施肥 量 zx 的 增加 产量 y 先是 增加 ,但 当 工 过 多 后 > 反而 减少 ,这 符合 农业 常 
识 , 所 以 不 应 拟 合 线性 函数 ,可 能 是 二 次 函数 比较 合适 ,所 以 建立 如 下 的 回归 模型 ， 
> 一 记 十 Biz 十 pz 十 (61) 
如 记 zi 二 Xx,X2 二 ,(61) 式 仍 属于 (58) 式 所 示 的 多 元 线性 回归 模型 ,可 用 MATLAB 命 
令 regress 求解 ,将 回归 系数 的 估计 值 代 入 (61) 式 得 到 y 的 预测 方程 为 
> 一 175.62 十 217.87z 一 13.15z?. 
回归 系数 置信 区 闻 和 统计 量 等 输出 从 略 ( 结 果 显 示 可 通过 模型 的 有 效 性 检验 )， 
《61) 式 又 称 二 项 式 回归 ,一 元 多 项 式 回 归 模 型 的 一 般 形式 为 
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7 一 所 十 RPRz 十 … 十 Boz 7 十 s. (63) 
用 MATLAB 求解 一 元 多 项 式 回归 ,除了 polyfit(x,y,m) 外 ,还 有 更 方便 的 命令 : 


Polytool(x,y,m,alpha) 


输入 x,y,m 同 polyfit, alpha 是 显著 性 水 平 a( 默 认 时 设 定 为 0.05), 输 出 一 个 如 
图 12. 19 的 交互 式 画 面 , 实 线 (屏幕 上 显示 为 绿色 ) 为 多 项 式 回归 曲线 y, 它 两 侧 的 虚线 
(屏幕 上 显示 为 红色 ) 标 出 y 的 置信 区 间 . x 的 数值 可 以 用 鼠标 移动 来 改变 ,也 可 以 在 图 下 
方 的 窗口 内 输入 ,图 左边 相应 地 给 出 y 的 预测 值 及 其 置信 区 间 . 通过 图 左下 方 的 Export 
下 拉 式 菜单 ,还 可 以 输出 回归 系数 估计 值 及 其 置信 区 间 、 残 差 等 . 

你 不 妨 试 试看 ,用 以 上 3 种 办 法 是 否 会 得 到 相同 的 结果 . 
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7 4 6 8 iD i4 3 45678 1011 评 

图 12.18 西红柿 施肥 量 与 产量 的 散 点 图 12.19 西红柿 施肥 量 与 产量 回归 模型 

. 输出 的 交互 式 画 面 

例 4 商品 销售 量 与 价格 

某 厂 生 产 的 一 种 电器 的 销售 量 y 与 竞争 对 手 的 价格 zx 和 本 三 的 价格 xz, 有 关 . 表 12. 17 
是 该 商品 在 10 个 城市 的 销售 记录 ,根据 这 些 数据 建立 y 与 :和 zs 的 关系 . 若 某 市 本 厂 产 
品 售 价 160( 元 ) ,竞争 对 手 售 价 170( 元 ) ,预测 该 市 的 销售 量 . | 
表 12.17 商品 销售 量 y 与 价格 x1 和 x, 


ZK1/ 元 120 


Xz/ 元 100 


模型 的 建立 和 求解 ” 作 表 12. 17 数据 (x, ，y),(xs，y) 的 散 点 图 如 图 12. 20, 可 以 看 
出 y 与 x 有 和 较 明 显 的 线性 关系 ,而 y 与 Xx! 之 间 的 关系 难以 确定 ,需要 试验 不 同 的 回归 模 
型 ,用 统计 分 析 决 定 优 劣 ， 
首先 建立 最 简单 的 一 次 函数 的 回归 模型 
yy 一 让 十 Brzi 十 Brzs 十 gs. (64) 
用 MATLAB 命令 regress 求解 ,得 到 结果 如 表 12. 18. 
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图 12.20 商品 销售 量 y 与 价格 x: 和 x 的 散 点 图 


表 12.18 模型 (64) 的 计算 结果 


回归 系数 回归 系数 估计 值 回归 系数 置信 区 间 
Bb, 66. 5176 [一 32.5060 165.5411 ] 
有 0.4139 [一 0.2018 1.0296] 
Bb 一 0.2698 [一 0.4611 一 0.0785 ] 


R:= 0.6527 下 一 6.5786 p=0.0247 s:=351.0445 


可 以 看 出 结果 不 是 太 好 ;p 二 0.0247, 取 a 二 0.05 时 回归 模型 (64) 有 效 , 但 取 a 二 0.01 则 模 
型 不 能 用 ;R? 较 小 ;8 的 置信 区 间 包 含 零点 . 
作为 模型 (64) 的 改进 ,建立 二 次 函数 的 回归 模型 如 

y=bB+TBzithr hzr! th ri te, (65) 
y= Bthzritphzr thBrzr+t hri hzri te. (66) 

它们 仍 是 多 元 线性 回归 模型 ,可 用 MATLAB 命令 regress 求解 . 

”: (65) 式 、(66) 式 属于 二 元 二 项 式 回 归 , 更 一 般 的 多 元 二 项 式 回归 模型 可 表 为 

> 一 房 十 BRm 十 十 Bozn 十 2) Barrirs te. (67) 


1&j ken 


MATLAB 统计 工具 箱 提供 了 一 个 很 方便 的 多 元 二 项 式 回归 的 命令 : 
rstooltx,y,'mode!',alpha) 
输入 x 为 自 变 量 (nXm 撼 阵 ,” 是 数据 容量 ),y 为 因 变 量 (x 维 向 量 ) ,atpha 为 显著 性 


水 平 <( 软 认 时 设 定 为 0.05) ,model 从 下 列 4 个 模型 中 选择 1 个 (用 字符 串 输 入 ,默认 时 设 
定 为 线性 模型 ) : 
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linear( 只 包含 线性 项 ); 
purequadratic( 包 含 线性 项 和 纯 二 次 项 ); 
interaction( 包 含 线性 项 和 纯 交 互 项 ); 
quadratic( 包 含 线性 项 和 完全 二 次 项 ,如 (67) 式 ). 
输出 一 个 交互 式 画面 . 

对 例 4 如 选择 模型 (65) ,编程 如 下 : 


x1=[...]; % 自 变 量 xi 数组 

x2=[...]; % 自 变量 x 数组 

VY [ed % 因 变 量 y 数组 

x= [x1' x2]; % 自 变量 矩阵 

rstool(x, y', 'purequadratic') % 包含 线性 项 和 纯 二 次 项 的 回归 


得 到 一 个 如 图 12. 21 的 交互 式 画 面 ,左边 一 幅 图 形 是 x; 固定 时 (图 中 为 188) 的 曲线 
y(zi) 及 其 置信 区 间 ,右边 一 幅 图 形 是 zi 国定 时 (图 中 为 151) 的 曲线 y(zz) 及 其 置信 区 
间 . 移动 鼠标 (或 在 图 下 方 窗口 内 输入 ) 可 改变 zi ,zs ,图 左边 给 出 y 的 预测 值 及 其 置信 区 
间 . 为 了 回答 例 中 * 若 某 市 本 厂 产品 售 价 160( 元 ) ,竞争 对 手 售 价 170( 元 ) ,预测 该 市 的 销售 
量 ” 的 问题 ,只 需 输入 zi 二 170,xi 一 160, 即 可 得 到 > 一 82. 0523<z82, 置信 区 间 为 82. 0523 士 
55. 8617, 即 大 约 是 [26 ,138] ,一 个 太 大 的 区 间 . 


图 12.21 商品 销售 最 与 价格 模型 的 一 个 交互 式 画 面 


图 的 左下 方 有 两 个 下 拉 式 菜单 ,上 面 的 菜单 Export 用 以 向 MATLAB 工作 区 传送 数 
据 , 包 括 回归 系数 8 菜单 中 为 Parameters， 工 作 区 输入 beta) ,剩余 标准 关 ;( 菜 单 中 为 
RMSE, 工作 区 输入 rmse) 等 .下 面 的 菜单 用 以 在 上 述 4 个 模型 中 变更 诛 来 的 选择 . 

对 于 例 4 我 们 将 4 个 模型 输出 的 回归 系数 8 和 剩余 标准 差 s 列 人 表 12. 19 ,发 现 模型 
purequadratic( 即 模型 (65) ) 的 s 最 小 ,可 以 选 作 最 终 模 型 . 
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表 12.19 商品 销售 量 与 价格 的 4 个 模型 的 输出 


B S 
| purequadratic 一 312.5871| 7.2701 | 一 1. | 一 0.0228 0. 0037 | 16. 6436 
quadratic 一 307. ， 7.2032 | 一 1. 二 0. 0001 | 一 0.0226 | 0.0037 18. 6064 
interaction 137.5317| 一 0.0372 | 一 0.7131 0.0028 19. 1626 
linear 66.5176| 0.4139 | 一 0.2698 下 | 18.7362 


12.3.8 变量 选择 与 逐步 回归 


实际 问题 中 影响 因 变量 的 因素 可 能 很 多 ,除了 自 变量 z; ，zz ,…，zn 外 ,还 会 有 它们 
的 简单 函数 如 zx? ,1/zi,e ,ln x;(i€E (1,2,… ,加 }) 等 . 从 应 用 的 角度 我 们 既 希 望 将 所 有 对 
因 变 量 影响 显著 的 因素 都 纳 和 人 回归 模 型 ,又 希望 最 终 的 模型 尽量 简单 , 即 包含 尽量 少 的 因 
素 , 这 就 涉及 所 谓 的 “变量 选择 ”问题 . 

(1) 变量 选择 的 标准 

简单 地 说 就 是 所 有 对 因 变量 影响 显著 的 变量 都 应 选 信 模型 而 影响 不 显著 的 变量 都 
不 应 选 入 模型 . 最 常用 的 数量 标准 之 一 是 剩余 方差 , 即 以 了 最 小 的 模型 为 最 终 模型 , 

若 候选 的 变量 集合 为 5 二 {zi ,zs，… ,zn) ,其 中 包含 自 变量 xz;，xz ,… ,zn 和 它们 的 简 
单 函数 (如 上 述 ) ,从 S 中 选 出 一 个 子 集 Si, 设 S, 中 有 上 个 变量 (pk) ,由 S 和 因 变 量 y 
构造 的 线性 回归 模型 的 残 差 平方 和 为 Q@, 由 (44) 式 知 模 型 的 剩余 方差 为 5 一 Q/(n 一 一 
1) ,nn 为 数据 容量 . 改变 子 集 Si 中 的 变量 使 尽量 小 ,通常 线性 回归 模型 中 包含 的 自 变量 
越 多 , 残 差 平方 和 QQ 越 小 ,但 车 模型 中 增加 的 是 对 > 影响 很 小 的 变量 ,那么 的 分 子 Q 由 
于 这 些 变量 的 加 入 只 会 减少 一 点 ,分 母 却 因 p 的 增加 而 有 可 观 的 减少 (尤其 当 不 太 大 
时 ), 于 是 可 能 使 反而 变 大 ,因此 将 剩余 方差 了 最 小 作为 衡量 变量 选择 的 数量 指标 ,可 以 
达到 最 终 模型 中 只 包含 重要 变量 的 目的 . 
”” 当 候 选集 合 3 中 的 变量 数目 不 大 时 ,可 以 用 枚 举 法 从 所 有 子 集中 选 出 小 的 最 
模型 ,而 逐步 回归 是 一 种 迭代 式 的 选择 重要 变量 的 方法 . 

(2) 逐步 回归 

逐步 回归 的 基本 思路 为 , 先 从 候选 集合 中 确定 一 初始 子 集 , 然 后 每 次 从 子 集 外 (候选 
集合 内 ) 引 入 一 个 对 y 影响 显著 的 变量 ,再 对 原来 子 集中 的 变量 一 一 进行 检验 ,如 除 那些 
影响 变 得 不 显著 的 变量 ,如 此 和 迭代 式 地 进行 引入 和 剔除 ,直到 不 能 进行 为 止 . 

使 用 逐步 回归 有 两 点 值得 注意 ,一 是 选择 衡量 影响 显著 程度 的 统计 量 ,通常 用 的 是 偏 
下 统计 量 ( 由 引入 或 吻 除 变量 后 回归 平方 和 的 改变 量 来 定义 ) ,二 是 要 适当 地 选取 引入 变 
量 的 显著 性 水 平 ww 和 剔除 变量 的 显著 性 水 平 gow ,调整 we 和 ao 的 大 小 可 以 控制 引入 和 剔 


lo 
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除 的 松紧 度 ,以 便 控制 最 终 模 型 内 的 自 变量 数目 ， 

逐步 回归 中 可 能 出 现 这 样 的 现象 :在 引 和 人 新 的 变量 后 原来 模型 内 影响 显著 的 变量 变 
得 不 显著 ,从 而 被 剔除 ,这 是 由 于 自 变 量 之 间 存 在 相关 性 的 缘故 . 顺便 指出 ,在 回归 模型 中 
如 果 某 些 自 变 量 之 间 的 线性 相关 性 很 强 ,那么 数据 矩阵 X(C(36) 式 ) 的 相应 的 列 向 量 就 会 
接近 于 线性 相关 ,从 而 使 矩阵 XXX 病态 ,给 回归 系数 的 求解 ((40) 式 ) 带 来 困难 ,并 且 回 归 
系数 的 置信 区 间 ((48) 式 ) 会 很 大 ,不 利于 模型 的 应 用 . 这 种 现象 在 回归 分 析 中 称 多 重 共 线 
性 ,应 该 尽量 选取 相互 独立 性 强 的 自 变量 ,避免 这 种 现象 . 

(3) MATLAB 中 的 逐步 回归 

MATLAB 统计 工具 箱 中 的 逐步 回归 命令 是 stepwise, 它 并 没有 按照 上 述 步骤 自动 
和 迭代 ,而 是 提供 几 个 交互 式 画面 ,让 你 自由 地 人 工 选 择 变量 ,进行 统计 分 析 , 其 通常 用 


.法 是 ， 


stepwise (x,y,inmodel!, penier, premove) 


输入 x 为 候选 变量 集合 的 nXk 数据 矩阵 (” 是 数据 容量 , & 是 变量 数目 ),y 为 因 变 量 
数据 向 量 (n 维 ) ,inmodel 是 初始 模型 中 包括 的 候选 变量 集合 的 指标 (和 矩 阵 x 的 列 序数 , 默 
认 时 设 定 为 全 部 候选 变量 ), penter 是 引入 变量 的 显著 性 水 平 ( 默 认 时 设 定 为 0. 05)， 
premove 是 噜 除 变 量 的 显著 性 水 平 (默认 时 设 定 为 0. 10). 

通过 下 面 的 例子 说 明 这 个 命令 的 用 法 . 

例 5 儿童 的 体重 与 身高 和 年 龄 

调查 了 12 名 6 至 12 岁 正常 儿童 的 体重 、 身 高 和 年 龄 ,如 表 12. 20, 建 立 回归 模型 用 
于 从 身高 和 年 龄 预测 儿童 的 体重 . 

表 12.20 儿童 的 体重 .身高 和 年 龄 


序号 体重 /kg 身高 /m “| 年 龄 / 岁 序号 体重 /kg 身高 /m ”| 年 龄 / 岁 
1 27.:1 1. 34 8 | 7 30.9 1. 39 10- 
2 30.2 1.49 10 8 27.8 1.21 9 

6 | 29.4 | 1. 26 10 


记 儿 童 的 体重 为 因 变 量 y, 身 高 和 年 龄 分 别 为 自 变量 zj ，xi， 分 别 画 出 y 与 xz 和 yy 
与 zz 的 散 点 图 ,如 图 12. 22. 可 以 看 出 ,它们 之 间 可 能 存在 着 二 次 函数 关系 . 
将 Xz, 及 XX 二 7?, 工 二 ,Xs 二 X17Xs 确 定 为 候选 变量 集合 ,选取 初始 子 集 为 xi ， 
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12. 22 儿童 的 体重 》 与 身高 *: 和 年 龄 x 的 散 点 图 


Xz， 显著 性 水 平 二 0.05, 记 yziyzayzsyz4yzs 为 由 表 12. 20 得 到 的 各 变量 的 数据 向 量 ， 
令 输 入 数据 矩阵 x 二 [zi ,x2 ,Ts ;4 ,Ts ]izxs , 作 逐 步 回 归 的 MATLAB 命令 为 


stepwise (xyy,[1,2]) 


运行 这 个 命令 将 输出 一 个 图 形 窗口 ,如 图 12. 239. 

图 左上 部 的 窗口 用 圆 点 和 线段 显示 x 中 各 个 候选 变量 的 回归 系数 估计 值 及 其 置信 区 
间 , 蓝 色 和 红色 分 别 相应 于 在 和 不 在 模型 中 的 变量 , 粗 线段 和 细 线 段 分 别 表示 90% 和 
95% 的 置信 区 间 . 图 右上 部 的 窗口 中 列 出 一 个 统计 表 , 包 括 各 个 候选 变量 的 回归 系数 估计 
值 二 统计 量 和 一 个 概率 值 ( 其 含义 与 ttest 中 的 sig 相同 ). 当 用 鼠标 单 击 左 上 部 的 圆 点 或 
右上 部 的 字段 时 ,可 使 之 由 红 变 蓝 , 于 是 该 变量 被 引入 ;或 者 由 蓝 变 红 ,于 是 该 变量 被 易 
除 . 图 右上 部 也 有 提示 :“Next step:?” 告 诉 你 下 一 步 应 该 引 人 或 剔除 哪个 变量 ,按照 这 个 
提示 只 需 单 击 这 个 按钮 即 可 . 

图 的 中 间 是 相应 于 当前 模型 的 一 些 输出 ,有 模型 常数 项 所 的 估计 值 Cintercept) ,决定 
系数 R? ,下 统计 景 ,剩余 标准 差 (RMSE) ,p 值 等 . 可 以 用 使 * 达到 最 小 作为 确定 最 终 模 
型 的 标准 ,不 一 定 遵照 “Next step; Move no terms” 的 提示 . | 

图 下 部 的 窗口 用 圆 点 记录 每 次 选取 模型 的 剩余 标准 差 s, 供 比 软 用 . 当 鼠 标 指向 某 个 
圆 点 时 ,就 显示 那个 模型 包含 的 变量 ; 若 单 击 圆 点 , 则 重 现 那个 模型 的 结果 ， 

通过 图 形 右 方 的 Export 下 拉 式 菜单 可 以 向 MATLAB 工作 区 传送 数据 (用 法 与 
rstool 相同 ). 

这 些 图 形 界面 都 有 热点 , 移 到 图 形 的 某 个 热点 时 ,鼠标 的 指针 会 变 成 一 个 小 圆圈 , 单 
击 后 会 产生 交互 作用 . 

从 例 5 初始 模型 的 输出 (图 12. 23) 出 发 ,将 zx;，z4， zs 一 个 个 地 引信 或 剔除 ,比较 s 
的 大 小 ,可 知 包含 3 个 变量 x1， xs， zt 时 :最 小 , 且 输 出 的 下 ,zp 值 可 通过 模型 的 有 效 性 检 


@ MATLAB7.0 以 前 版 本 输出 3 个 图 形 窗口 ,内容 与 这 里 的 大 致 相同 ， 
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验 . 选择 图 12. 24 为 最 终结 果 ,于 是 我 们 的 最 终 模型 为 
”y= 二 25.8287 十 5.3289zx) 一 2.6849zxz 十 0.2380zxi. (68) 


238034 


12.23 例 5 的 初始 结果 


图 12.24 例 5 的 最 终结 果 


12.4 非 线性 回归 分 析 


上 面 两 节 讨论 的 模型 对 回归 系数 是 线性 的 ,它们 计算 简单 ,使 用 方便 . 在 根据 一 批 观 
测 数据 建立 模型 时 ,如 果 我 们 对 因 变 量 与 自 变量 之 间 的 关系 没有 多 少 确定 的 、 先 验 的 认 
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识 ,通常 都 选择 线性 模型 ,其 中 的 函数 可 以 是 一 次 的 .二 次 的 ,或 有 交互 项 等 ,经 济 . 社 会 、 
生理 、 医 学 等 领域 往往 如 此 . 而 在 一 些 工程 技术 问题 中 经 常 根据 某 些 知识 或 经 验 , 知 道 变 
量 之 间 的 函数 关系 ,需要 的 只 是 根据 观测 数据 确定 其 中 的 系数 ,那么 当 因 变量 对 待定 系数 


非 线性 时 ,如 12, 1.4 节 酶 促 反应 ,就 会 遇 到 实验 7 介绍 的 非 线 性 最 小 二 乘 拟 合 . 非 线性 回 


” 归 可 以 对 非 线性 最 小 二 乘 拟 合 的 结果 给 以 统计 分 析 . 
12.4.1 非 线 性 最 小 二 乘 拟 合 


非 线性 最 小 二 乘 拟 合 问题 的 提 法 是 :已 知 模型 
一 Cr8)，x 一 (zzo)， 8 一 (PbB)， (69) 
其 中 了 对 8 是 非 线 性 的 ,为 了 估计 参数 8 ,收集 个 独立 观测 数据 (xi, yi) ,Xi 二 (xa ，*…， 
Za) (i 二 1 ,n,n 之 m). 记 拟 合 误 差 6e;(B ) 二 yy 一 fx;,B), 求 B 使 误差 平方 和 


ms De (8) Dry, = (70) 
最 小 . 
在 实验 7 中 作为 无 约束 非 线 性 规划 的 特例 ,我 们 介绍 过 非 线性 最 小 二 乘 拟 合 的 解法 ， 
以 及 MATLAB 优化 工具 箱 中 的 命令 lsqnonlin 和 lsqcurvefit, 用 它 对 12. 1. 4 节 酶 促 反 应 
的 模型 (1) 求 解 , 得 到 


ee CA 
12.4.2 非 线 性 回归 分 析 
像 线性 回归 分 析 一 样 , 非 线性 回归 模型 记 作 
[3= f(x,B)+e, X= (Xi Xn), B= (BB:,* ,BbB), (72) 


le ~ N(0,0), 
其 中 f 对 回归 系数 8 是非 线性 的 ,观测 数据 记号 同 前 ,使 (随机 ) 误 差 平 方 和 达到 最 小 , 求 
解 得 到 回归 系数 8 的 最 小 二 乘 估 计 , 记 作 . 
MATLAB 统计 工具 箱 中 非 线 性 回归 的 命令 是 : 
[b,R,J]=nlinfit(x, y,'model', b0) 


输入 x 是 自 变量 数据 矩阵 ,每 列 一 个 变量 ;y 是 因 变 量 数据 向 量 ;model 是 模型 的 函数 
名 (M 文件 ) ,形式 为 y 二 f(b,x) ,bb 为 待 估 系 数 B ; b0 是 回归 系数 8 的 初 值 . 输出 b 是 p 
的 估计 值 ,R 是 残 差 ,J 是 用 于 估计 预测 误差 的 Jacobi 和 矩阵. 这 个 命令 是 用 高 斯 一 牛顿 法 
求解 的 . 

将 上 面 的 输出 作为 命令 
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‘bi= nlparci(b,R ,J) 
的 输入 ,得 到 的 bi 是 回归 系数 8 的 置信 区 间 . 用 命令 
ntintool(x,y, 'model',b) 


可 以 得 到 一 个 交互 式 画 面 ,其 内 容 和 用 法 与 多 项 式 回 归 的 Polytool 类 似 . 
用 非 线 性 回归 求解 12. 1. 4 节 的 非 线性 模型 ,编程 如 下 : 


function y=fun(b,x) % M 文 件 ,b 是 待 估 参 数 

y=b(1) x x./(b(2) +x); % 模型 (1) 

x=[...]; % 已 知 的 自 变量 数组 

y=[...]; % 已 知 的 因 变 量 数组 

b0=[143 0.03]; % 取 线 性 化 模型 的 结果 为 B 的 初 值 
[b,R,J]=nlinfit(x, y, fun', b0) ; % 非 线 性 回归 系数 B 的 估计 值 
bi=nilparci(b,R,J); % 回归 系数 B 的 置信 区 间 

b,bi % 输出 B 的 估计 值 和 置信 区 间 
xx=0:0.01: 1.2; 

yy=b(1) x xx./(b(2) + xx); % 用 有 的 估计 值 计算 y 的 预测 ( 拟 合 ) 值 
plotCx,y,'+',xx, yy) ,pause % 数据 散 点 图 和 预测 ( 拟 合 ) 曲 线 
nlintool C(x, y, fun', b) % 交互 式 画面 

得 到 


b = 160.2781 0.0477 
bi = 145.6191 174.9372 
0.0301 0.0653 
B 的 估计 值 与 最 小 二 乘 拟 合 得 到 的 完全 相同 ,不 过 用 非 线性 回归 还 可 得 到 8 的 置信 区 间 . 
数据 散 点 图 和 预测 ( 拟 合 ) 曲 线 见 图 12. 25, 可 与 图 12. 3 比较 . 交互 式 画面 见 图 12. 26， 
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图 12.25 非 线 性 模型 的 预测 ( 拟 合 曲线 ) 图 12.26 非 线性 模型 的 交互 式 画面 
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12.4.3 酶 促 反 应 的 混合 反应 模型 


考虑 12. 1.4 节 的 第 2 个 问题 一 一 嗓 叭 霉 素 处 理 对 酶 促 反 应 模型 中 参数 BP. ,Be 的 影 
响 . 为 了 在 同一 个 模型 中 考虑 这 个 影响 ,采用 在 原来 的 模型 中 附加 增 量 的 方法 ,考察 如 下 
的 混合 反应 模型 : 


和 (8 + yza ) x 73 
(a 十 Yoxz) 十 工 !” Re 


其 中 自 变 量 xz 为 底 物 浓度 ((71) 式 中 的 zx) ,zs 为 一 示 性 变量 (0-1 变量 ) ,zs 一 0 表示 未 经 
嗓 叭 霉 素 处 理 ,zz: 一 1 表示 经 过 处 理 ; 参 数 8 ,po 仍 是 未 经 处 理 的 最 终 反 应 速度 和 半 速 度 
点 ,而 Xi 是 经 哇 叭 伦 素 处 理 后 最 终 反 应 速度 的 增长 值 ,y* 是 经 处 理 后 半 速 度 点 的 增 
长 值 . 

. 这 个 模型 的 求解 作为 习题 留 给 读者 . 
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实验 目的 

1， 了 解 回归 分 析 的 基本 原理 ,掌握 MATLAB 实现 的 方法 : 

2. 练习 用 回归 分 析 解 决 实际 问题 . 

实验 内 容 

1. 用 切削 机 床 加 工时 ,为 实时 地 调整 机 床 需 测定 刀具 的 磨损 速度 ,每 隔 一 小 时 测量 
刀具 的 厚度 得 到 以 下 数据 ( 见 表 12. 21) ,建立 刀具 厚度 对 于 切削 时 间 的 回归 模型 ,对 模型 
和 回归 系数 进行 检验 ,并 预测 7. 5h 和 15h 后 的 刀具 厚度 ,用 (30) 和 (31) 式 两 种 办 法 计算 
预测 区 间 ,解释 计算 结果 ， 


表 12.21 


时 间 /h 
刀具 厚度 /cm 


| E 10 
27.0 | 26.8 | 26.5 


2. 电影 院 调 查 电 视 广 告 费用 和 报纸 广告 费用 对 每 周 收入 的 影响 ,得 到 下 面 的 数据 
( 见 表 12. 22) ,建立 回归 模型 并 进行 检验 ,诊断 异常 点 的 存在 并 进行 处 理 . 

3. 营养 学 家 为 研究 食物 中 蛋白 质 含 量 对 婴儿 生长 的 影响 ,按照 食物 中 蛋白 质 含 量 的 
高 低 , 调 查 了 两 组 两 个 月 到 3 岁 婴 儿 的 身高 , 见 表 12. 23 和 表 12. 24. 
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表 12. 22 


每 周 收 入 96 90 95 92 95 95 94 94 


| 
电视 广告 费用 | 1.5 2.0 | i- 25 | 3.3 | 2.3 | 4.2 | 2.5 
报纸 广告 费用 


年 龄 / 岁 
身高 /cem | 54 | 55 | 63 | 66 | 69 | 73 | 82 | 83 | 80 | 91 | 93 | 94 | 94 


(1) 分 别 用 两 组 数据 拟 合 食 物 中 蛋白 质 高 、 低 含量 对 婴儿 身高 的 回归 直线 ,解释 所 得 


(2) 怎样 检验 食物 中 蛋白 质 含量 的 高 低 对 婴儿 的 生长 有 无 显著 影响 ? 检验 结 
如 何 ? | . 
4. 13 名 少年 儿童 参加 了 一 项 睡眠 时 间 与 年 龄 关系 的 调查 , 表 12. 25 中 的 (每 和 天) 睡眠 
时 间 (min) 是 根据 连续 3 天 记录 的 平均 值得 到 的 . 

表 12.25 13 个 人 的 睡眠 时 间 与 年 龄 


序号 睡眠 时 间 /min | ” 年龄 / 岁 序号 睡眠 时 间 /min 年 龄 / 岁 
1 586 4.4 8 、 515 8.9 
wa 
2 462 14.0 9 493 11.1 
3 491 10.1 10 ”528. 7.8 
4 565 6.7 11 576 5.5 
5 | 462 11.5 12 533 8.6 
6 532 9.6 13 531 0 
7 478 12.4 


(1) 画 出 散 点 图 ,建立 回归 模型 并 检验 模型 的 有 效 性 ,解释 得 到 的 结果 . 
(2) 给 出 10 岁 孩 子 的 平均 睡眠 时 间 及 预测 区 间 . 
5. 社会 学 家 认为 犯罪 与 收入 低 ` 失 业 及 人 口 规模 有 关 , 对 20 个 城市 的 犯罪 率 y( 每 
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10 万 人 中 犯罪 的 人 数 ) 与 年 收入 低 于 5000 美元 家 庭 的 百分比 z 、 失 业 率 x 和 人 口 总 数 


za( 于 人 ) 进 行 了 调查 ,结果 如 表 12. 26. 
表 12. 26 
序号 By 21 Zz YY3 序号 了 SI 2 3 

1 | 11.2 16.5 6.2 | 587 11 14.5 18. 1 6.0 7895 
2 13. 4 20.5 6.4 643 12 26.9 23.1 7.4 762 
3 40.7 26.3 9.3 635 13 15.7 19.1 5.8 2793 
4 5. 3 16. 5 5.3 14 36.2 24.7 8.6 741 
5 24.8 19.2 7.3 1248 15 18.1 18.6 6.5 625 
6 12.7 16.5 5.9 643 16 28,9 24.9 8.3 854 
7 20.9 20.2 6.4 1964 17 14.9 17.9 6.7 716 
8 35.7 21.3 7.6 1531 18 25.8 22.4 8.6 921 
9 8.7 下 4.9 713 19 21.7 .20.2 8.4 595 
10 9.6 14.3 6.4 749 20 25.7 16. 9 6.7 3353 

(1) 若 zi 一 zs 中 至 多 只 许 选 择 2 个 变量 ,最 好 的 模型 是 什么 ? 

(2) 包含 3 个 自 变 量 的 模型 比 上 面 的 模型 好 吗 ? 确定 最 终 模型 . 

(3) 对 最 终 模型 观察 残 差 ,有 无 异常 点 , 若 有 ,剔除 后 如 何 . 

6. 为 得 到 研磨 机 速度 ( 转 /min) 与 纤维 制品 磨损 量 的 关系 ,在 6 种 不 同 转速 


8 块 同样 材料 的 制品 进行 试验 ,结果 如 表 12. 27. 
表 


12. 27 


下 分 别 对 


(1) 假定 磨损 量 与 转速 之 间 的 关系 是 线性 的 ,对 所 给 数据 采用 两 种 办 法 建立 模型 : 原 
始 数据 ; 先 将 每 种 转速 下 的 8 个 磨损 量 平均 . 比较 得 到 的 两 个 结果 的 异同 ,并 作 解 释 . 
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(2) 对 模型 (1) 作 改进 ,如 建立 二 次 函数 模型 (对 数据 仍 用 两 种 办 法 ). 

7. 在 有 氧 锻炼 中 人 的 耗 氧 能 力 y (ml/(min* kg)) 是 衡量 身体 状况 是 重要 指标 , 它 
可 能 与 以 下 因素 有 关 : 年 龄 zi ,体重 zs(kg) ,1500m 跑 用 的 时 间 zs (min) ,静止 时 心 速 x， 
(次 /min) ,跑步 后 心 速 zs (次 /min); 对 24 名 40 至 57 岁 的 志愿 者 进行 了 测试 ,结果 如 
表 12. 28. 试 建立 耗 氧 能 力 y 与 诸 因 素 之 间 的 回归 模型 . 


表 12.28 


14 47.2 47 79.2 6.36 47 162 
15 51.9 54 83.1 6.20 50 166 
16 49.2 49 81.4 5.37 44 180 
17 40.9 51 69.6 6.57 57 168 
18 46.7 | 51 709 6.00 48 162 
19 46.8 48 91.6 6.15 48 162 
a | 一 
20 50. 4 47 73.4 6.05 67 168 
21 39. 4 57 73.4 7.58 58 174 
22 46. 1 54 | 79.4 I 6.70 62 156 
23 45.4 52 76.3 5.78 48 164 
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(1) 车 工 ~~zs 中 内 许 选择 1 个 变量 ,最 好 的 模型 是 什么 ? 

(2) 若 zi~~zs 中 只 许 选择 2 个 变量 ,最 好 的 模型 是 什么 ? 

(3) 若 不 限制 变量 个 数 ,最 好 的 模型 是 什么 ? 你 选择 哪个 作为 最 终 模型 ,为 什么 ? 

(4) 对 最 终 模型 观察 残 差 ,有 无 异常 点 , 若 有 , 噜 除 后 如 何 . 

8. 汽车 销售 商 认 为 汽车 销售 量 与 汽油 价格 .贷款 利率 有 关 ,两 种 类 型 汽车 (普通 型 和 
察 华 型 )18 个 月 的 调查 资料 如 表 12. 29, 其 中 交 是 普通 型 汽车 售 量 ( 千 辆 ),》% 是 豪华 型 汽 
车 售 量 ( 千 辆 ) ,zi 是 汽油 价格 (元 /gal) ,x 是 贷款 利率 (%). 


表 12.29 
序号 1 2 Xl Xz 
1 22.1 7.2 1. 89 6.1 
2 15. 4 5. 4 1. 94 6.2 
3 11.7 7.6 1.95 6.3 
4 10.3 2.5 1. 82 8.2 
5 11.4 2.4 1.85 9.8 
6 725 1.7 1.78 10.3 
7 13.0 4.3 1.76 10.5 
8 12.8 3.7 1.76 8.7 
9 | 14.6 3.9 1.75 7.4 
10 18.9 7.0 1.74 6.9 
11 19.3 6.8 1:70 5.2 
==] 
12 30.1 10.1 1.70 4.9 
13 28.2 9.4 1.68 4.3 
14 25.6 人 1. 60 | 3.7 
15 37,5 14.1 1.61 3.6 
16 36.1 14.5 ]. 64 3 
17 39.8 14.9 1. 67 1.8 
的 1 
18 44.3 15.6 1. 68 2.3 


(1) 对 普通 型 和 豪华 型 汽车 分 别 建立 如 下 模型 ; 
yi 一 BY 二 Pi x 十 BY rs， yz 一 2 + Pi? zx 十 BB” za 
给 出 8 的 估计 值 和 置信 区 间 ,决定 系数 R* ,FF 值 及 剩余 方差 等 . 
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(2) 用 zy 二 0, 1 表示 汽车 类 型 ,建立 统一 模型 :y=B 十 Bizi 十 Bexs 十 Bx ,给 出 B 的 估 
计 值 和 置信 区 间 ,决定 系数 R? ,下 值 及 剩余 方差 等 . 以 x; 一 0, 1 代入 统一 模型 ,将 结果 与 
(1) 的 两 个 模型 的 结果 比较 ,解释 二 者 的 区 别 . 

(3) 对 统一 模型 就 每 种 类 型 汽车 分 别 作 zx, 和 zs 与 残 差 的 获 点 图 ,有 什么 现象 ,说 明 
模型 有 何 缺 陷 ? 

(4) 对 统一 模型 增加 二 次 项 和 交互 项 ,考察 结果 有 什么 改进 . 

9. 一 家 洗衣 粉 制造 公司 作 新 产品 试验 时 ,关心 洗衣 粉 泡沫 的 高 度 y 与 搅拌 程度 x; 和 
洗衣 粉 用 量 zz 之 间 的 关系 ,其 中 搅拌 程度 从 弱 到 强 分 为 3 个 水 平 . 试验 得 到 的 数据 如 
表 12. 30. 


表 12.30 

| Xz y Xl Zz 4 | Xz2 > 
1 6 28.1 2 6 65.3 3 6 82.2 
1 7 32.3 2 7 67.7 3 7 85. 3 
1 8 34.8 2 8 69.4 3 8 88.1 
1 9 38. 2 2 9 ?2 3 9 90. 7 
1 10 43.5 2 10 76.9 3 10 93.6 


(1) 将 搅拌 程度 zi 作为 普通 变量 ,建立 y 与 :和 zs 的 回归 模型 ,从 残 差 图 上 发 现 
问题 . 

(2) 将 搅拌 程度 zi 视 为 没有 定量 关系 的 3 个 水 平 ,用 0-1 变量 表示 ,建立 回归 模型 ， 
与 (1) 比 较 . 从 残 差 图 上 还 能 发 现 什么 问题 . 

(3) 加 入 搅拌 程度 与 洗衣 粉 用量 的 交互 项 ,看 看 模型 有 无 改进 . 

10. 表 12. 31 列 出 了 某 城 市 18 位 35~ 44 岁 经 理 的 年 平均 收入 xi1( 千 元 ) ,风险 偏好 
度 xz; 和 人 寿 保 险 额 y( 千 元 ) 的 数据 ,其 中 风险 偏好 度 是 根据 发 给 每 个 经 理 的 问卷 调查 表 
综合 评估 得 到 的 , 它 的 数值 越 大 ,就 越 偏 爱 高 风险 . 研究 人 员 想 研究 此 年 龄 段 中 的 经 理 所 
投保 的 人 寿 保险 额 与 年 均 收 入 及 风险 偏好 度 之 间 的 关系 . 研究 者 预计 ,经 理 的 年 均 收入 和 
人 寿 保 险 额 之 间 存 在 着 二 次 关系 ,并 有 把 握 地 认为 风险 偏好 度 对 人 寿 保 险 额 有 线性 效应 ， 
但 对 于 风险 偏好 度 对 人 寿 保 险 额 是 否 有 二 次 效应 以 及 两 个 自 变量 是 否 对 人 寿 保险 额 有 交 
互 效应 ,心中 没 底 . 

通过 表 12. 31 中 的 数据 来 建立 一 个 合适 的 回归 模型 ,验证 上 面 的 看 法 ,并 给 出 进一步 
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表 12.31 

序号 y Zl I2 序号 y 1 I 
1 196 66. 290 7 10 49 37. 408 5 
2 63 40. 964 5 11 105 54.376 2 
3 252 72.996 10 12 98 46. 186 7 
4 84 45. 010 6 13 77 46.130 4 
5 126 57. 204 4 14 14 30. 366 3 
6 14 26. 852 5 15 56 39.060 5 
7 49 38. 122 4 16 245 79. 380 1 
8 49 35. 840 6 17 133 52.766 8 
9 266 75.796 9 18 133 55. 916 6 


11. 一 个 医药 公司 的 新 药 研究 部 门 为 了 掌握 一 种 新 止痛 剂 的 疗效 ,设计 了 一 个 药物 
实验 ,给 24 名 患 有 同 种 病痛 的 病人 使 用 这 种 新 止痛 剂 的 以 下 4 个 剂量 中 的 某 一 个 :2,5， 
7,10(g) ,并 记录 每 个 病人 病痛 明显 减轻 的 时 间 (min). 为 了 解 新 药 的 疗效 与 病人 性 别 和 
血压 有 什么 关系 ,试验 过 程 中 研究 人 员 把 病人 按 性 别 及 血压 的 低 、 中 、 高 3 档 平 均 分 配 来 
进行 测试 . 通过 比较 每 个 病人 血压 的 历史 数据 ,从 低 到 高 分 成 3 组 ,分 别 记 作 0. 25,0. 50 
和 0. 75. 实 驴 结束 后 ,公司 的 记录 结果 见 表 12. 32( 性 别 以 0 表示 女 ,1 表示 男 ). 

请 你 为 公司 建立 一 个 模型 ,根据 病人 用 药 的 剂量 ,性别 和 血压 组 别 , 预 测 出 服药 后 病 
痛 明 显 减轻 的 时 间 . 


表 12.32 


| 病痛 减轻 时 间 /min 


用 药剂 量 /g 


35 


血压 组 别 


0. 25 


4 47 2 1 0. 25 
5 43 2 1 0.50 
6 57 2 1 | 0. 75 
7 26 5 0 0. 25 
8 27 5 0 0.50 
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续 表 
病人 序号 病痛 减轻 时 间 /min 用 药剂 量 /g 性 别 血压 组 别 
9 28 5 0 0.75 
10 29 5 1 0. 25 
11 22 5 1 0. 50 
12 29 5 1 0.75 
13 19 7 0 0. 25 
14 11 7 0 0. 50 
15 14 7 0 0.75 
16 23 7 1 0. 25 
17 20 7 1 0. 50 
18 22 | 7 下 0.75 | 
19 13 10 0 0. 25 
20° 8 10. 0 0. 50 
21 3 10 0 0.75 
22 27 10 1 0. 25 
23 26 10 1 0. 50 
24 5 10 1 0.75 


12， 对 于 酶 促 反应 中 的 反应 速 


计 值 及 其 置信 区 闻 ,检验 回归 系数 是 否 为 零 ,得 


速度 与 底 物 浓度 的 混合 反应 模型 (73) ,计算 回归 系数 估 
导 到 你 认为 最 好 的 模型 . 


13. Logistic 增长 曲线 模型 和 Gompertz 增长 曲线 模型 是 计量 经 济 学 等 学 科 中 的 两 
个 常用 模型 ,可 ea 


ee 于 二 记 i 增长 曲线 模型 为 y, = 


Le “ ,这 两 个 模型 中 上 的 经 济 学 意义 都 是 销售 量 的 上 限 . 表 12. 33 中 给 出 的 是 某 地 区 
高 压 锅 的 销售 量 (单位 :万 台 ) ,为 给 出 此 两 模型 的 拟 合 结果 ,请 考虑 如 下 的 问题 : 
(1) Logistic 增长 曲线 模型 是 一 个 可 线性 化 模型 吗 ? 如 果 给 定 上 二 3000, 是 否 是 一 个 


记 Logistic 增长 曲线 模型 为 y, = 


可 线性 化 模型 ,如 果 是 ,试用 线性 化 模型 给 出 参数 a 和 的 估计 值 . 


(2) 利用 (1) 所 得 到 的 a 和 的 估计 值 和 工 二 3000 作为 Logistic 模型 的 拟 合 初 值 ,对 
Logistic 模型 做 非 线性 回归 . 


(3) 取 初 值 工 2 一 3000 ;000 


一 30,，&22 一 0.4, 拟 合 Gompertz 模型 . 并 与 Logistic 模型 


的 结果 进行 比较 . 


表 12.33 
年 份 y 年 份 有 y 
Ee | ES | 

1981 0 43.65 1988 7 1238.75 

1982 1 109. 86 1989 8 1560. 00 

1983 2: 187. 21 1990 9 1824. 29 

| 

1984 3 312. 67 1991 10 2199. 00 

1985 4 496. 58 1992 11 2438. 89 
2737,;71 
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”人工 神经 网 络 


神经 网 络 是 大 脑 的 一 个 组 成 部 分 . Jamesc 在 1890 年 的 《心理 学 ) 一 书 中 这 样 描述 神 
经 网 络 的 基本 原理 :大 脑 皮 层 每 一 点 的 活力 是 由 其 他 点 势能 释放 的 综合 效能 产生 的 ,这 些 
势能 同 下 面 的 因素 有 关 : (1) 相 关 点 的 兴奋 次 数 ; (2) 兴 奋 的 强度 ; (3) 与 其 不 相连 的 其 他 
点 所 接受 的 能 量 . 他 的 这 一 原理 一 直 沿 用 至 今 . 到 目前 为 止 , 神 经 网 络 的 研究 主要 分 为 两 
个 派别 :一 派 主要 包括 生物 学 家 、 物 理学 家 和 心理 学 家 等 ,他 们 研究 的 主要 目的 是 给 出 大 
脑 活动 的 描述 和 精细 模型 ; 另 一 派 主要 包括 工程 技术 人 员 等 ,他 们 关心 的 是 怎样 利用 神经 
网 络 的 基本 原理 ,来 构造 解决 实际 问题 的 算法 ,使 得 这 些 算法 具有 有 效 的 计算 能 力 . 这 个 
实验 的 内 容 属 于 后 者 ,我 们 称 其 为 神经 网 络 的 工程 应 用 研究 ,或 称 为 人 工 神经 网 络 
(artificial neural network, ANN) ,简称 神经 网 络 . 

人 工 神经 网 络 的 早期 工作 可 以 追溯 到 1943 年 McCulloch 和 Pitts'4 建 立 的 第 一 个 模 
型 ,后 被 扩展 为 “ 认 知 (perceptron)” 模 型 . 认 知 模型 的 一 个 功效 是 可 以 用 来 解决 简单 的 分 
类 问题 . 但 是 1969 年 Minsky 和 Papertt 在 4《 认 知 论 》 一 书 中 指出 : 认 知 模型 无 法 解决 最 
为 经 典 的 “ 异 或 (exclusive-or,XOR) ”问题 . 这 个 结论 使 得 有 关 人 工 神经 网 络 的 研究 一 度 
陷入 了 危机 . 20 世纪 80 年 代 , Hopfield 将 人 工 神经 网 络 成 功 地 应 用 于 解决 组 合 优化 问 . 
题 , McClelland 和 Rumelhartt 构 造 的 多 层 反 向 学 习 算 法 成 功 地 解决 了 单 隐 含 层 认 知 网 
络 的 “ 异 或 ?问题 及 其 他 的 识别 问题 . 他 们 的 突破 使 得 人 工 神经 网 络 成 为 新 的 研究 热点 . 

人 工 神经 网 络 可 以 分 为 前 向 型 和 反馈 型 两 类 :前 向 型 神经 网 络 的 特点 是 信息 传递 由 
后 层 神经 元 向 前 层 神经 元 传递 ,同一 层 内 的 神经 元 之 间 没 有 信息 交流 ;反馈 型 神经 网 络 中 
的 神经 元 之 间 不 但 相互 作用 ,而 且 自身 也 有 信息 内 耗 . 进一步 ,还 可 以 按 神经 元 的 学 习 过 
程 , 将 神经 网 络 细 分 为 有 指导 和 无 指导 学 习 神 经 网 络 ( 无 指导 学 习 的 形式 为 自 组 织 和 自 
学 习 ). 

本 实验 主要 以 MATLAB 提供 的 神经 网 络 工 具 箱 (neural network toolbox) 为 基础 ， 
介绍 前 向 神经 网 络 的 模型 和 算法 .13. 1 节 给 出 一 个 经 过 简化 的 实际 问题 ,13. 2 节 给 出 神 
经 网 络 的 基本 概念 ,重点 讨论 单 层 前 向 神经 网 络 ,13. 3 节 讨 论 多 层 前 向 神经 网 络 ,并 给 出 


13.1 旋 记 的 诊断 


问题 的 求解 和 分 析 过 程 ,13. 4 节 介 绍 MATLAB 神经 网 络 工具 箱 的 图 形 交 互 界 面 ,13. 5 
节 分 析 和 求解 13. 1 节 的 问题 ,13. 6 节 布 置 实验 练习 ， 


13.1 话 亡 的 诊断 


诡 妄 是 由 于 各 种 原因 引起 的 急性 脑 器 质 性 综合 症 ,其 特征 是 急性 起 病 , 意 识 水 平 变 
化 ,病程 波动 ,定向 力 、 注 意 力 、 思 维 、 精 神 运动 .行为 和 情感 改变 . 根据 国外 1980 年 以 后 有 
关 诡 亡 研 究 文献 的 报道 , 诡 亡 的 发 病 率 为 4%~25%. 目前 对 诺 亡 的 发 病 机 制 还 了 解 得 不 
多 ,诊断 的 方式 常 采 用 多 个 指标 综合 评价 . 如 对 老年 诡 亡 ,通常 采用 检查 表 的 方式 确诊 , 检 
查 表 中 的 11 个 项 目 包含 : 

。 急性 起 病 : 病 人 的 精神 状况 有 急性 变化 的 证 据 吗 ? 
注意 障碍 :患者 的 注意 力 难以 集中 吗 ? 
思维 混乱 :患者 的 思维 是 凌乱 或 不 连贯 的 吗 ? 
意识 水 平 的 改变 :总 体 上 看 ,您 如 何 评估 该 患者 的 意识 水 平 ? 
定向 障碍 :在 会 面 的 任何 时 间 患 者 存在 定向 障碍 吗 ? 
记忆 力 减 退 : 在 面谈 时 患者 表现 出 记忆 方面 的 问题 吗 ? 
知觉 障碍 :患者 有 知觉 麻 碍 的 证 据 吗 ? 
精神 运动 性 兴奋 :面谈 时 患者 的 行为 活动 有 不 正常 的 增加 吗 ? 
精神 运动 性 迟缓 ;面谈 时 患者 有 运动 行为 水 平 的 异常 减少 吗 ? 
波动 性 :患者 的 精神 状况 (注意 力 、 思 维 、 定 向 .记忆 力 ) 在 面谈 前 或 面谈 中 有 波 
动 吗 ? 

。 睡眠 -觉醒 周期 的 改变 :患者 有 睡眠 -觉醒 周期 紊乱 的 证 据 吗 ? 

针对 以 上 11 个 问题 ,医生 对 病人 进行 观察 和 提问 ,每 项 分 4 个 等 级 打分 :不 存在 一 一 
1 分 ; 轻 度 存在 一 一 2 分 ;中 度 存在 一 一 3 分 ;严重 存在 一 一 4 分 . 

. 表 13. 1 为 一 位 医生 对 96 名 测试 人 员 的 观察 和 提问 ,并 通过 记分 方法 记录 下 的 直观 
判断 . 诊断 标准 为 :22 分 以 上 可 诊断 为 话 记 ,在 量 表 诊断 一 列 中 记 为 了 (否则 记 为 N). 这 
样 的 标准 是 否 合理 ? 实际 上 已 经 知道 ,前 48 个 数据 来 自 临床 诊断 的 病人 ,后 48 个 数据 来 
自 正常 人 . 可 以 看 出 , 量 表 诊 断 一 共 出 现 了 10 个 诊断 错误 的 病例 , 占 测试 人 员 的 10. 4%， 
这 是 一 个 比较 高 的 错误 率 . 

我 们 将 在 13. 5 节 继 续 讨 论 这 个 问题 . 
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13.2 单 层 前 向 人 工 神 经 网 络 


13.2 单 层 前 向 人 工 神经 网 络 


13.2.1 人 工 神经 网 络 的 基本 概念 
图 13. 1 是 生物 学 中 神经 网 络 的 简 图 . 


ON 唱 枝 (dendrite) 
Em (body) 


轴 突 (axon) 


突 触 (synapse) 


图 13.1 生物 学 中 神经 网 络 简 图 


神经 网 络 是 大 脑 的 重要 成 分 ,由 相互 关联 的 神经 元 组 成 ,每 一 个 神经 元 又 由 内 核 . 轴 
突 和 多 个 唱 枝 组 成 . 晶 枝 形成 一 个 非常 精密 的 “ 毛 刷 ”环绕 在 内 核 周围 . 轴 突 可 以 想象 为 一 
根 又 长 又 细 的 管道 ,其 终点 分 为 众多 的 细小 分 支 , 将 内 核 的 信息 传递 给 其 他 内 核 的 唱 枝 . 
这 些 细小 分 支 的 头 , 即 那些 又 长 又 细 管 道 的 终点 , 称 为 突 触 , 其 主要 功能 是 接触 其 他 内 核 
的 唱 枝 . 

一 个 神经 元 通过 晶 枝 接收 到 信息 后 ,对 这 些 信息 进行 处 理 , 再 通过 所 控制 的 突 触 传送 
给 其 他 的 神经 元 . 每 个 神经 元 可 分 为 “抑制 ?或 “兴奋 ”两 种 状态 . 当 一 个 神经 元 接收 的 信息 
累计 超出 一 个 给 定 值 时 ,神经 元 被 激活 并 传递 出 信息 给 其 他 神经 元 ,这 种 传递 信息 的 神经 
元 处 于 “兴奋 ”状态 . 如 果 神 经 元 接收 到 其 他 神经 元 传递 过 来 的 信息 ,但 没有 向 外 传递 信 
息 , 则 这 个 神经 元 处 于 “抑制 ”状态 . 

简单 模拟 上 述 原理 的 人 工 神经 网 络 是 McCulloch-Pitts 认 知 网 络 ,如 图 13. 2 表示 . 

.图 13.2 中 一 个 神经 元 由 右 侧 的 唱 枝 .内 核 . 轴 突 和 突 触 表示 . 对 其 他 神经 元 输入 的 
Zzi, 晶 枝 以 ww,( 关 联 权 ) 的 感应 程度 接收 . 神经 元 接收 到 的 信息 为 其 他 神经 元 的 综合 信息 
xz 一 》 wizi 和 对 神经 元 自身 的 激励 6. 内 核 完成 对 信息 的 集成 ( 圆 的 左 半 部 ) 和 处 理 ( 圆 


的 右 半 部 ), 并 通过 轴 突 向 突 触 输 出 y. 函数 f(z 十 0) 称 为 激活 函数 (activation function) 或 
输出 函数 ， 
这 个 实验 的 网 络 中 ,将 按 习惯 用 和 矩形 表示 神经 元 的 输入 或 输出 , 圆 表 示 一 个 神经 元 的 
内 核 ,w 表示 晶 枝 的 感应 程度 , 称 为 权 数 ， 
McCulloch-Pitts 输出 函数 可 以 定义 为 . 
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2 实验 13 人 工 神 经 网 络 


突 触 J 内 核 


图 13.2 McCulloch-Pitts 网 络 


y= f(z+0 = sgn( >)rozi 十 0)， (1) 
i=1 


]， 之 二 
其 中 sgn(Cz) 一 ,0>0 时 ,可 以 理解 为 外 部 给 神经 元 的 额外 刺激 值 ;6 过 0 时 ,一 


可 以 理解 为 神经 元 本 身 具有 的 六 值 (threshold). 9 统称 为 激励 值 . | 

从 (1) 式 可 以 看 出 , 当 w 和 0 给 定时 ,对 一 组 输入 (zz ，…zw)7 ,很 容易 计算 输出 
值 . 我们 的 问题 主要 是 ,对 给 定 的 输入 ,确定 参数 w; 和 0, 尽 可 能 使 (1) 的 计算 输出 同 实际 
输出 相 吻 合 . 

建立 和 应 用 神经 网 络 大 致 可 以 归结 为 3 个 步骤 :网 络 结构 的 确定 , 权 数 的 确定 和 工作 
阶段 . 

网 络 结构 的 确定 ”主要 内 容 包 含 :网 络 的 拓扑 结构 和 每 个 神经 元 激活 函数 的 选取 . 

拓扑 结构 是 一 个 神经 元 的 基础 . 本 实验 只 讨论 前 向 神经 网 络 , 它 的 拓扑 结构 为 ;信息 
由 下 一 层 的 神经 元 向 上 一 层 的 神经 元 传递 ,同一 层 内 的 神经 元 之 间 没 有 信息 传递 . 

激活 函数 的 类 型 比较 多 , 除 阶 跃 函 数 (1) 外 ,常用 的 还 有 线性 函数 和 Sigmoid 函数 (S 


形 函 数 ). 线性 函数 即 ee 中 
f(x) = ax++b, (2) | 
其 中 4 和 6 是 实 常数 . Sigmoid 函数 为 (图 13. 3): J 
1 A 
f(x) > ] 二 ew (3) g 
在 识别 和 分 类 问题 中 ,如 果 采 用 阶 跃 酒 数 , 当 输 图 13.3 S 形 函数 


出 值 为 1 时 ,我 们 可 以 肯定 地 判断 输入 的 类 别 . 阶 唉 
函数 的 缺点 是 数学 性 质 较 差 , 如 在 0 点 不 光滑 等 . Sigmoid 函数 弥补 了 这 一 方面 的 不 足 ， 
使 得 函数 值 在 (0.1) 区 间 连 续 、 光 滑 地 变化 . | 

为 了 取得 其 他 区 间 的 函数 输出 , 需 对 阶 路 函数 或 S 形 函数 进行 简单 的 修改 . 如 需要 
(一 1, 士 1) 的 输出 , 则 阶 跃 通 数 为 2sgn(z) 一 1,S 形 函数 为 2f(z) 一 1 


13.2 单 层 前 向 人 工 神 经 网 络 


关联 权 和 激励 值 的 确定 ” 权 和 激励 值 是 通过 学 习 ( 或 称 为 训练 ) 得 到 的 ,可 以 分 为 有 
. 指导 学 习 和 无 指导 学 习 两 类 . 依据 已 知 一 组 正确 的 (或 称 为 理想 的 ) 输 入 .输出 数据 ,调整 
并 确定 权 数 w; 和 激励 值 9, 使 得 网 络 输出 同 理 想 输出 偏差 尽量 小 的 方法 称 为 有 指导 学 
习 . 在 只 有 输入 数据 而 不 知 输出 结果 的 条 件 下 ,确定 权 数 的 方法 称 为 无 指导 学 习 . 在 学 习 
过 程 中 ,采用 不 同 的 准则 函数 将 得 到 不 同 的 学 习 规 则 . 

工作 阶段 ”用 带 有 确定 权 数 和 激励 值 的 神经 网 络 去 解决 实际 问题 的 过 程 称 为 工作 或 
模拟 (simulate). ; 

当然 ,学 习 和 工作 并 不 是 绝对 地 分 为 两 个 阶段 ,可 以 通过 学 习 , 工 作 、 再 学 习 、 青 工作 
的 循环 过 程 ,逐步 提高 人 工 神 经 网 络 的 应 用 效果 . 

图 13.4 是 前 向 型 人 工 神 经 网 络 的 计算 流程 .第 一 个 阶段 如 图 13. 4(a) 描 述 , 它 的 主 
要 步 又 是 :在 选择 网 络 结构 模型 和 学 习 规 则 后 ,根据 已 知 的 输入 和 理想 输出 (学 习 数 据 )， 
通过 学 习 规 则 确定 神经 网 络 的 权 和 激励 值 . 这 正如 一 个 医学 院 的 学 生 , 可 以 通过 教科 书 中 
病例 的 发 病症 状 和 诊断 结果 ,来 学 习 诊 断 . 第 二 个 阶段 如 图 13. 4(b) 描 述 , 它 的 主要 步骤 
是 :按照 第 一 个 阶段 确定 的 模型 和 得 到 的 权 , 根 据 实际 问题 的 输入 数据 给 出 一 个 结论 . 这 
正如 一 个 医学 院 的 毕业 生 , 在 遇 到 病人 后 ,根据 医学 院 学 到 的 诊断 方法 ,给 出 病人 的 一 个 


输入 


人 出 
神经 癌 络 模型 ， | 箱 出 _ 
确定 权 数 和 激励 值 一 一 


实际 数据 


神经 网 络 模型 ; 


已 经 确定 
(a) 第 1 阶段 (b) 第 2 阶段 
图 13.4 神经 网 络 计算 流程 


学 习 数据 : 权 数 和 激励 值 
输入 和 输出 


依据 神经 网 络 的 层 数 和 激活 函数 的 类 型 ;前 向 型 神经 网 络 还 可 以 进一步 细 分 .下 面 就 
从 简 到 繁 地 介绍 前 向 型 神经 网 络 . 


13.2.2 单 层 前 向 神经 网 络 一 一 线性 网 络 


本 节 只 讨论 有 指导 学 习 的 情况 , 单 层 前 向 神经 网 络 (single layer feed-forward neural 
networks) 的 模型 结构 如 图 13. 5. | 

在 单 层 前 向 神经 网 络 中 ,只 有 输入 层 和 输出 层 . 输入 层 中 的 每 一 个 元 素 表示 轴 突 ,而 
输出 层 中 的 每 一 个 元 素 代表 一 个 神经 元 的 内 核 , 由 此 得 名 为 单 层 神经 网 络 . 单 层 前 向 神经 
网 络 中 同一 层 中 的 元 素 无 带 权 的 弧 相 连 . 

记 输 入 变量 为 二 (ri ,Ta 汪汪 ,输出 结果 为 Y= (yi yz ;Yn) ,0 = (0; 0 
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Xi - 
输入 层 4 
网 
输出 层 


图 13.5 单 层 前 向 神经 网 络 
6,)7 ,wi 为 输入 i 同 神经 元 j 的 权 数 , 则 第 j 个 神经 元 的 接收 和 输出 信 为 
z) 一 Duwir,, yj = f(z t0), j= 1,2,n. (4) 
用 和 矩阵、 向量 表 示 为 


i i de A 
W = 站 ,Y= FWX+0) = (f(z + 0 f(z, + 0,))T. 
TO Ta Tym 
(5) 
(1) 线性 网 络 
线性 网 络 具有 图 13. 5 的 结构 ,是 最 简单 的 一 类 神经 网 络 , 它 采用 (2) 式 的 激活 函数 ， 
令 a 一 1,0 一 0 得 
Y 一 WX 二 O. (6) 
为 了 使 得 网 络 输出 同 理想 输出 最 为 接近 ,常用 的 学 习 规 则 是 最 小 二 乘 准 则 . 设 一 组 学 习 样 
本 为 {CXC(1),DCOD)),…,(X(J),DC(J))), 其 中 (2 二 Crs,Tn (1)) 一 1 2 
有 ,DO 二 (qd1(t),…,d,(t))7, 是 XX(z) 的 理想 输出 .目标 函数 为 


J 
E(W) = De A — DOO) YO — D0), YO) = WXG)+0. (7) 


7 一] 


记 马 一 (X(1) ,…,X(CJD)) ,Y= (CY) ,YY(CTD)) 和 五 =(CD(1),…,D(J)), 则 殖 一 W 有 十 
0 (1,…,1)1xy. 计算 EW) 对 W 的 导数 ,并 令 其 为 零 ,得 


aE(W) 1 3% 
= SWYG) 0— DUN)TWYG) 十 9 一 DCD) 
aW J 请 之 
了 


(Y (1) — D(C(1),,Y(]) — DO CX ,XT )T 


my 
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= WXX +0 (1, iw" — DX') = 0. (8) 
只 要 输入 (4) 的 向 量 秩 为 m, 我 们 就 可 以 由 (8) 式 得 到 (7) 式 的 最 优 解 
-. W= (D—0(0,1,.,1)w YT XX). (9) 


理论 上 这 是 一 个 非常 好 的 结果 ,但 是 分 析 人 类 的 学 习 过 程 ,是 通过 一 个 一 个 样本 的 训 
练 来 完善 大 脑 神经 记忆 的 . 模仿 这 样 的 过 程 ,让 学 习 样本 一 个 一 个 地 到 达 , 称 为 自 适 应 线 
性 (Adaline,adaptive linear) 网 络 , 每 到 达 一 个 样本 ,系统 将 学 习 并 更 新 权 数 . 

设 关 =(zi ,zz ,Xa) 和 DD 二 (di,4di,…,4d,)" 分 别 是 随机 选取 的 一 对 用 于 学 习 的 
输入 .输出 向 量 ,了 二 WX 十 9 是 实际 输出 向 量 . 由 (7) 式 


下 


EW) = (> unz 十 b 一 性， (10) 
j=1 l=1 
进而 
2E(W) = 2zi( > wiz 十 0 —4d;)= 2(Yy; — dj;)xi. 
Oj 1=1 
EW) 下 降 的 方向 为 
ce aoECW) _ 2 es rg ee 
HUW 2 dw 、 eld; DE z 一 ]1， om, J Ls My (11) 
其 中 e 为 学 习 效 率 . 于 是 权 数 的 变化 形式 为 
多 人 二 1) 三 到 人 十 9 到 (的 = WO) +e (dj;(2) ~ y(t) ) z(t) ) xm: (12) 


(9) 式 和 (12) 式 都 是 由 最 小 二 乘 准 则 得 到 的 确定 权 数 的 公式 ,它们 的 区 别 是 :(9) 式 将 
所 有 的 学 习 样 本 看 成 一 个 总 体 ,一 次 计算 出 权 值 ,使 得 学 习 数 据 的 计算 输出 与 理想 输出 偏 
差 平方 和 最 小 ; (12) 式 每 学 习 一 对 输入 和 输出 ,对 权 数 进行 一 次 修改 ， 

最 小 二 乘 准则 应 用 于 自 适应 线性 网 络 得 到 的 (12) 式 称 为 Widrow-Hoff 学 习 规 则 ,或 
Hebb 规则 ,它们 可 以 统称 为 误差 修正 规则 . 

实际 上 ,(11) 式 是 函数 下 (多 ) 下 降 的 方向 .在 什么 样 的 条 件 下 ,可 以 保证 (12) 式 友人 代 
收 伍 且 为 (7) 式 的 局 部 最 优 解 办 ? Widrow 和 Stearns 呈 给 出 了 收敛 的 充分 条 件 为 


De 一 co， De < ce. (13) 
例如 ,e, 一 二 明显 地 满足 条 件 (13). 


当 输 入 有 一 (ZI Ta 本 后 ， 线性 网 络 的 计算 输出 yi 是 >; 一 Dr 的 一 个 放 


大 、 缩 小 或 位 移 , 只 与 其 相关 的 权 数 和 输入 值 有 关 , 因而 了 个 输出 层 神经 元 是 相互 独立 
的 ,所 以 可 以 采用 单个 输出 神经 元 研究 其 网 络 的 特性 . 
(2) 线性 网 络 的 MATLAB 实现 
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MATLAB 中 产生 线性 网 络 结构 的 命令 为 ; 


rte nowlieasny 


其 中 A 为 mX2 的 矩阵 ,mm 为 输入 变量 的 个 数 ,每 一 行 分 别 表示 对 应 输入 分 量 的 下 、 上 上 界 ， 
n 为 输出 变量 的 个 数 ， 
学 习 规则 (9) 的 命令 为 : 


, net = newlind(P,T); 


其 中 P 为 学 习 的 输入 数据 矩阵 X,T 为 学 习 的 理想 输出 和 矩阵 D. 
计算 网 络 输出 的 命令 ; 


result= sim(net, Q) ; 


其 中 Q 为 工作 (应 用 ) 阶 段 需 要 计算 的 输入 矩阵 ， 
当 所 有 时 段 上 的 学 习 效 率 6, 一 1 时 ,学习 规则 (12) 的 命令 为 : 


net = trainCnet,P,T); 


这 个 命令 的 运行 方式 为 :对 (Pi;T} 学 习 数 据 按 输入 和 理想 输出 一 对 对 地 用 (11) 式 学 习 ，, 对 
{P;T} 学 习 一 遍 后 ,将 以 (11) 式 计算 的 结果 求 和 ,作为 权 数 
的 改变 值 ,然后 用 (12) 式 求 得 新 的 权 数 . 这 样 学 习 一 遍 , 称 
为 一 轮 (epoch). 在 使 用 net = train(net,P,T) 前 ,需要 给 
定 目标 函数 (7) 的 平均 (误差 ) 方 差 的 上 限 和 计算 的 最 大 轮 
数 ( 见 例 3)，. 

例 1 设 网 络 结构 、 权 数 和 激励 值 均 已 给 定 ( 图 
Ta 上 图 13.6 例 1 的 网 络 结构 


TO21 U22 


的 ,六 局 值 各 一 0. 5， bh 一 0, 输出 ?一 全 ']= WX 十 &. 当 工作 阶段 的 输入 为 


yz 


(1;1),(1,2),(2,3),(2,1) 时 ,计算 神经 网 络 的 输出 . 
解 用 MATLAB 编程 如 下 : 


A=[1 2;1 3]; % 输入 变量 的 下 界 和 上 界 ( 根 据 输入 设 定 ) 
n=2; % 输出 变量 的 个 数 

net= newlin(A,n); % 产生 线性 网 络 结构 

net.IWi{1,1} = [1.5 2.5; 15]; % 设 定 权 数 

net.b{1) =[0.5; 0]; % 设 定 激励 值 

P=[1122;1231]; % 给 定 输入 


resuit= sim(net,P) % 计算 输出 
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得 到 的 结果 为 


result 二 4.5 7.0 11.0 6.0 
6.0 11.0 17.0 7.0 


个 例子 告诉 我 们 :首先 要 用 net=newlin(A,n) 产 生 单 层 线性 网 络 结构 ; 当权 数 和 激 
励 值 已 知 时 ,用 net.IW{1,1} 输 入 权 数 ,IW{1,1} 表 示 从 输入 层 到 输出 层 的 权 数 ,用 
net.b{1} 输 入 输出 层 神经 元 的 外 部 激励 值 ,输入 形式 为 一 个 n 维 列 向 量 ;最 后 通过 
sim(net,P) 完 成 工作 阶段 的 功能 . 

例 2 设 网 络 结构 仍 为 图 13. 6, 若 学 习 样 本 采用 例 1 的 输入 : (1,1),(1,2),(2,3)， 
(2,1) ,对 应 的 理想 输出 设 为 (4,5), (6,10),(10,17),(5,5), 采 用 整体 学 习 方 法 , 即 规则 
(9) ,计算 网 络 的 输出 ,以 及 权 数 和 激励 值 . 

解 用 MATLAB 编程 如 下 : 


A=[1 2; 1 3]; 
n=2; 
net=newlin(A,n); 
P=[1 1 2 2;1 2 3 1]; 
T=[4 6 10 5;5 10 17 5]; % 给 定理 想 输 出 
net = newlind(Pp,T); % 实现 学 习 规 则 (9) 
result= sim(net, P) % 计算 输出 
weight= net. IW{1,1} % 输出 权 数 
bias= net.b{1) % 输出 激励 值 

得 到 的 结果 为 


result= 3.8 6.2 9.9 5.1 
4.6 10.4 16.8 5.2 
weight =1.3 2.4 
0.6 5.8 
bias = 0.1 
一 1.8 


例 3 如 果 对 例 2 的 数据 采用 自 适 应 地 按 轮 学 习 , 即 按 (1,1;4,5},{1,2;6,10),1{2 
3;10,17), {2,1;5,5} 的 顺序 一 个 个 地 学 习 ,4 组 都 学 习 完 后 ,累加 修正 权 数 ,从 头 开始 再 
学 习 . 计算 输出 结 

解 用 MATLAB 编程 如 下 : 

A=[1 2;1 3]; 

n=2; 


net=newlin(A,n); 
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net.IW{1,1} = [1.5 2.5; 1 5]; % 权 的 初 值 , 若 不 给 定 , 则 自动 (随机 ) 生 成 
net.b{1} =[0.5; 0]; % 激励 的 初 值 , 若 不 给 定 , 则 自动 (随机 ) 生 成 
P=[1 1 2 2;1 2 3 1]; 

T=[4 6 10 5;5 10 17 5]; 


net. trainParam. goal= 0.1; % 平均 方差 的 上 限 不 超过 0.1 
net. trainParam. epochs = 200; % 学 习 的 轮 数 不 超过 200( 默 认 值 为 100) 
[neit, tr] = trainCnet,P,T) ; % 实现 学 习 规 则 (12) 
result= sim(net, P) 
得 到 的 结果 为 


TRAINB, Epoch 0/200, MSE 1.15625/0.1. 
TRAINB, Epoch 25/200, MSE 0.281641/0.1 
TRAINB, Epoch 50/200, MSE 0.199741/0.1 
TRAINB, Epoch 75/200, MSE 0.154344/0.1. 
TRAINB, Epoch 100/200, MSE 0. 12819/0.1 
TRAINB, Epoch 125/200, MSE 0.11232/0.1. 
TRAINB, Epoch 150/200, MSE 0. 102065/0.1. 
TRAINB, Epoch 157/200, MSE 0.0998318/0.1. % 至 157 轮 达 到 平均 方差 上 限 的 要 求 
TRAINB, Performance goal met. 
result = 3.864. 6.235 9.846 5.104 
4.980 10.588 16.472 5.257 


如 果 要 查看 权 数 和 激励 值 , 可 以 像 例 2 一 样 做 . 

例 4 自 适 应 滤波 (adaptive filtering) 是 自 适应 线性 网 络 的 一 个 应 用 . 对 按时 序 输入 、 
每 两 个 之 间 有 一 定时 滞 的 信和 号 ,经 自 适 应 滤波 处 理 后 ,按时 序 输出 结果 . 如 图 13. 7 的 一 个 
具有 4 个 信号 处 理 能 力 的 自 适 应 滤波 系统 ,每 个 信号 间 的 时 灌 为 4 王 1, 系 统 接收 到 4 个 
信号 后 的 输出 为 

yi) 一 TIZC) 十 sz 一 1) 十 rszC 一 2) 十 oz 一 3) 十 0D，L 一 1)，2)，… 

假设 输入 信和 号 的 范围 为 L1,20], 按 时序 输 入 的 信号 为 {1,2,3,4,5,6,7} ,理想 输出 信 
号 为 {10,20,30,40,50,60,70), 设 初始 信号 为 [Lx(0),x( 一 1),x( 一 2)] 二 [8,9,10], 用 学 
习 规 则 (12) 计 算 自 适应 滤波 的 输出 . 

解 MATLAB 程序 为 ; 


net = newlinC[1,20],1); 
net. inputWeights{1,1}.delays = [0 1 2 3]; % 4 个 信号 之 间 的 延 时 顺序 
pi=(8910); % 初始 信号 
P= {1234567); 
={10 20 30 40 50 60 70}; 
net. adaptParam. passes = 40; % 学 习 的 轮 数 不 超 过 40 
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图 13.7 自 适 应 滤波 系统 


net.trainParam.goal=0.1; % 平均 方差 的 上 限 不 超过 0.1 
Enet,y, pf] = adaptCnet,P,T;pi) % 实现 学 习 规则 (12) 
得 到 的 结果 为 : 
y = 10.2369 20.2080 29.7509 40.6235 50.0679 59.6587 69.6452 
pf = [5] [6] [7J % 将 不 足 4 个 的 输入 信号 不 加 处 理 地 输出 
13.2.3 阶 跃 网 络 
(1) 基本 原理 


激活 函数 采用 阶 跃 天 数 的 网 络 称 为 阶 牙 网 络 , 即 激活 函数 为 
y; = flz;+b;) 一 sgn( D> wri+b), j= 1,2,,n. 


阶 跃 网 络 的 学 习 规 则 来 源 于 最 小 二 乘 目标 函数 得 到 的 (12) 式 . 给 定 初始 权 WC1) 和 
阐 值 5(1) ,假设 第 (= 二 1,2,…) 个 学 习 数 据 为 x(2) 王 《x1(2) ,z(t),… ,zm(t)) ,网 络 输出 
为 y() 二 《yi ,yz (7) ，… ,y(t)) ,理想 输出 为 4《2) 二 (di(2) ,qds(1),…,d; (2))' ,学 习 规 
则 是 

Wl 二 +1) = WO +oeWG) = WO) (qd;() ~— y; 2) ) xilt) ) xm (14) 
blt+1) 一 bi 十 CC — y(t). (15) 
阶 路 网 络 处 理 的 输出 是 0-1 变量 ,如 果 给 定 的 分 类 问题 或 判定 问题 是 线性 可 分 的 , 即 


如 图 13.8 所 示 ,存在 一 条 直线 (或 平面 ) 工 将 平面 (或 空间 ) 分 为 两 部 分 ,使 得 理想 输出 为 . 


1(Y 表示 ) 和 0(N 表示 ) 的 输入 点 分 别 在 各 自 一 半 的 部 分 中 . 

从 理论 上 来 说 ,上 面 的 学 习 规 则 可 以 在 有 限 步 内 确定 权 数 ,使 得 阶 跃 网络 得 到 正确 的 
输出 . 需要 注意 的 是 ,对 非 线性 可 分 问题 ,无论 是 线性 还 是 阶 牙 单 层 网 络 都 无 法 得 到 理想 
的 结果 . 

(2) 阶 牙 网 络 的 MATLAB 实现 
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MATLAB 中 产生 阶 路 网 络 结构 的 命令 为 : 
net 一 Dn n) ; 

其 中 A,n 与 线性 网 络 的 命令 相同 . 其 他 命令 如 
result= simCnet,Q)i net = train(net,P,T); 


的 用 法 也 与 线性 网 络 相 同 . 

例 5 与 例 1 相同 的 网 络 结构 ,有 学 习 样 本 输入 
为 (1,1),(1,2),(2,3),(2,1), 理 想 输出 为 (1,0)， 
(0,1), (0,1),(1,0), 用 阶 路 网络 和 规则 (2) 学习, 输 
出 结果 . 

解 ” 程 序 为 : 


A=[1 2; 1 3]; 

n=2; 

net= newp(A,n); % 产生 阶 牙 网 络 结构 
P=[1 1 2 2;1 2 3 1]; 

T=[1 0 0 1;0 1 1 0]; 

[net, tr] = trainCnet,P,T); 

result= sim(net, P) 


“计算 结果 为 


TRAINC ，Epoch 0/100 
TRAINC ，Epoch 6/100 
TRAINC，Performance goal met. 
result = 1 0 0 1 

0 1 1 0 


图 13.8 线性 可 分 示意 图 
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用 一 个 两 层 的 神经 网 络 ( 图 13. 9) 来 讨论 多 层 前 向 神经 网 络 (multi-layer feed 
forward neural networks). 为 了 方便 起 见 ,各 层 的 元 素 都 称 为 神经 元 . 

图 13. 9 中 输入 层 、 隐 层 、 输 出 层 分 别 有 3 个 .2 个 和 4 个 神经 元 . 前 向 网 络 要 求 每 一 
层 内 的 神经 元 无 相连 关系 ,而 上 一 层 ( 左 边 ) 的 输出 是 下 一 层 ( 右 边 ) 的 输入 ， 

对 于 一 般 的 多 层 前 向 神经 网 络 ,如 果 记 输入 层 为 第 0 层 , 输 出 层 为 第 K 层 , 称 为 K 层 
网 络 . 除 输入 和 输出 以 外 的 层 称 为 隐 层 . 

从 输入 层 到 第 1 层 的 权 数 矩阵 用 IW{1,1) = (wi ), x 表示. 记 第 一 1 层 到 第 层 
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疝 罗 亲政 本 天 > 加 


输入 层 隐 有 层 输出 层 
图 13.9 二 层 前 向 神经 网 络 结构 示意 图 


的 权 数 和 矩 阵 为 LW{k,k 一 1) 二 (ws )，x,_,(k 之 2) ,其 中 ns 表示 第 层 神经 元 个 数 .输入 向 
量 为 发 一 (zi zz，… ;Ti jy 

若 多 层 神 经 网 络 的 每 一 层 都 采用 线性 激活 函数 输出 , 称 为 多 层 简单 线性 前 向 网 络 . 第 
n 层 的 输出 为 Z"= 二 LW{n,n 一 了 LW{n 一 1,n 一 2}…IW{1,1} 久 ,因此 ,多 层 简单 线性 前 向 网 
络 等 同 于 单 层 线 性 网 络 ,下面 不 再 讨论 . 

多 层 阶 路 激活 函数 的 神经 网 络 , 具 有 非常 好 的 分 类 功能 ,完全 可 以 解决 著名 的 “ 异 或 
问题 ”, 但 因 没 有 很 好 的 学 习 方法 , 故 在 实际 问题 中 应 用 较 少 . S 形 函 数 有 很 好 的 函数 特 
性 ,其 效果 又 近似 符号 函数 ,因此 下 面 讨 论 采 用 S 形 函数 的 前 向 多 层 神经 网 络 的 学 习 
方法 ， 


13.3.1 反 推 学 习 规 则 


给 定 一 个 输入 X= (ri yr2 ;Tn 和 理想 输出 D= (di,d:,** Ge 7 ; 记 


1 z! yy! fi(zi 二 0)) 
元 这 2 y} fi (2 二) 
X= z= WX, YY=| |= RN 
Lz 双 py 
第 & 一 1(& 之 2) 层 到 第 上 层 的 权 和 矩阵 .接收 值 向 量 和 输出 向 量 之 间 的 关系 为 
zt 次 
大 和 大 
之 2 2 
ZZ: 二 。 LW{Ek,E— 1}Y, 9 了 二 9 (17) 
Eo “ 人 


其 中 y= 二 f(z 十 纺 ) , 访 为 S 形 或 线性 函数 . 要 确定 IW{1,1),LW{k,k 一 1) (k 二 2,…， 
KK) ,使 得 | 
ECW) = (DYOT™D— Yr) (18) 
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最 小 . 由 于 ECW) 是 一 个 二 次 函数 且 S 形 或 线性 函数 可 微 ,因此 ,网 络 学 习 规 则 为 梯度 下 
降 方向 . 按 ECW) 隆 的 方向 确定 权 数 的 学 习 规则 为 
LW(Ek+1,R)G+1) = LW(E+1 RO) HOWa(t), . k= Kel1,,l, (19) 


1 /aECWO)) . 
SWi(t) = 0 ee (21) 


ei 为 第 上 步 的 学 习 效率 . 

由 具体 的 梯度 计算 可 以 看 到 (参看 文献 [10]) : 权 数 的 修正 是 从 最 后 一 层 神 经 元 的 权 
数 LW(K,K 一 1} 开 始 , 反 向 递 推 修正 KK 一 1 层 的 LW{K 一 1,K 一 2},…, 一 直 修 正 到 第 1 
层 的 权 数 IW{1,1}) ,因此 称 为 反 推 学 习 规则 (back-propagation,BP). 

多 层 前 向 网 络 的 学 习 分 为 成 批 和 逐一 两 种 方式 . 逐一 学 习 的 规则 是 :对 给 定 的 一 批 学 
习 数 据 ,每 学 习 一 个 输入 和 理想 输出 ,按照 (19) 一 (21) 式 修正 权 数 . 成 批 学习 将 数据 看 成 
一 批 ,每 学 完 一 批 数 据 后 ,修正 权 数 ,目标 函数 为 


~ 2 
 E(W) = PD —Yx())T (DG) 一 Yx(D) = Ws 


t=1 


E,W) = (DQG) —Yxr(2)) (DG) — Yr (0)). (22) 


反 推 (BP) 学 习 算法 | 四 aa 
步骤 1 给 定 学 习 数组 {XGD) ,DG)) (==1,2,…,]) ,随机 确定 初始 权 和 矩阵 W(0); 

给 定 最 小 二 乘 目 标 函 数 的 偏差 上 界 和 和 迭代 次 数 上 限 ; 

此 可 2 用 逐 -- 或 成 批 学 习 规则 修正 权 数 , 真 到 达到 信 差 要求 或 渤 代 次 数 上 限 


FE ye en ER FRR 2 RERRRRRDRR 


BP 算法 弥补 了 符号 函数 在 实际 应 用 中 难以 确定 权 数 的 不 足 ,这 使 得 具有 很 强 识别 功 
能 的 前 向 多 层 网 络 得 以 应 用 . 应 用 BP 算法 时 需要 注意 以 下 问题 

第 一 ,激活 函数 为 S 形 函数 ,只 能 趋 近 0 或 1. 于 是 ,在 神经 网 络 的 工作 阶段 ,输出 值 
只 能 接近 1 或 0. 判定 一 个 数组 的 归 类 问题 就 需要 给 出 一 个 分 界 值 ,而 不 是 绝对 的 1 或 0. 

第 二 ,W(0) 和 激励 初始 值 的 选取 最 好 是 随机 的 . 如 果 WW(0) 的 所 有 权 数 相等 ,每 个 神 
经 元 的 激励 值 相等 , 且 每 个 神经 元 有 相同 的 S 形 函数 时 ,由 (16) 式 和 (17) 式 可 以 推出 : 
无 论 什么 样 的 输入 X,Z, 中 的 全 部 分 量 相同 . 当 第 一 层 的 激活 函数 取 同 一 个 函数 时 ,Y 
的 全 部 分 量 相同 ; 当 每 一 层 的 激活 函数 取 同 一 个 函数 时 ,由 于 如 的 各 分 量 相同 ,所 以 
对 一 …= 宫 ,再 由 (21) 式 的 运算 得 (2250) 
的 修正 权 对 很 多 问题 无 法 识别 . 

第 三 ,算法 的 全 局 最 优 性 . 存在 的 理论 问题 之 一 是 选取 不 同 的 目标 函数 是 否 有 惟一 


、 ”中 的 所 有 元 素 相 等 . 由 此 得 到 
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的 极 值 点 ? 算法 能 否 收敛 到 局 部 最 优 (参看 文献 [6])? 为 了 避免 局 部 最 优 解 的 一 个 改 
进 方法 是 将 (21) 式 的 学 习 规则 修正 为 


,1 /IE(WO)) 四 
Wl) =— Fe( a oe 二 asWsCG 一 1D) (23) 
《23) 式 右 端的 第 二 项 相当 于 一 个 势能 “惯性 ”, 式 中 的 a 决定 于 权 数 两 次 变化 的 相互 


第 四 , 当 学 习 数 据 给 定 后 ,(18) 式 或 (22) 式 是 一 个 非 线 性 二 次 函数 ,因此 ,BP 算法 
主要 采用 与 梯度 下 降 有 关 的 学 习 方 法 . 非 线性 函数 优化 有 很 多 的 方向 下 降 方 法 ,这 些 
方法 都 可 以 应 用 在 BP 学 习 算 法 中 ,下 面 将 讨论 不 同方 法 的 应 用 . 

13.3.2 MATLAB 的 实现 


MATLAB 中 产生 前 向 多 层 网 络 结构 的 命令 为 : 
net= newff(A,B, {C} , 'trainfun') ; 


其 中 A 是 一 个 no。X2 的 矩阵 ,no 为 输入 层 变量 的 个 数 ,每 一 行 分 别 表示 对 应 输入 分 量 
的 下 .上 界 ; Wa 其 分 量 为 对 应 层 神经 元 的 个 数 ;C 是 一 个 及 维 的 


字符 串 向 量 一 个 字符 串 分 量 为 对 应 层 神经 元 的 激活 函数 ; trainfun 为 学 习 规 则 采用 
es 
MATLAB 中 激活 函数 为 
JoBaigC T= (24) 
人 人 = S 二 和 ， (25) 
purelin(z) = x . (26) 


其 字符 串 分 别 为 “logsig”，“tansig”“purelin”. 
训练 函数 trainfun 见 表 13. 2 
表 13.2 MATLAB 中 的 学 习 函 数 及 其 简单 描述 
MATLAB | : | 


函数 名 


traingd 基本 的 梯度 下 降 方法 :利用 (21) 式 进行 修正 ,收敛 慢 , 可 以 用 在 批量 或 逐一 学 习 规 则 . 


Pe 势能 修正 (gradient descent with momentum) 法 :利用 (23) 式 进行 修正 ,一般 比 traingd 收 
raingdm 


敛 快 , 可 以 用 在 批量 或 逐 学 习 规则 . 


一 -全 


traingdx 自 调整 学 习 效 率 (adaptive learning rate) 法 : 比 traingd 收 伍 束 度 快 , 仅 限 批量 学 习 规 则 . 
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MATLAB 


» 
函数 名 功 和 


恢复 BP 法 (resilient backpropagation) :依据 (22) 式 的 变化 情况 ,选择 权 数 修正 , 权 数 变 
trainrp 化 的 大 小 与 (22) 式 没有 直接 关系 ;收敛 速度 快 并 用 最 小 的 内 存 需 求 ; 仅 限 批量 学 习 
规则 . 


traincgf Fletcher-Reeves 共 斩 梯 度 法 :在 共 拒 梯度 法 中 内 存 需 求 最 小 , 仅 限 批量 学 习 规 则 . 
Polak-Ribiére 共 斩 梯 度 法 : 比 traincgf 的 内 存 需 求 稍 大 ,对 一 些 问题 的 收敛 速度 较 快 ， 


traincgp 


仅 限 批量 学 习 规则 . 
jin。 Powall-Beale 共 二 梯度 法 ; 比 traincgp 的 内 存 需 求 稍 大 ,一 般 有 有 较 快 的 收 伍 速度 , 仅 限 批 
rain 
2 量 学 习 规则 . 3 


trainscg 标量 (scaled) 共 碟 梯度 法 : 仅 有 的 不 需 线性 搜索 的 共 皂 梯度 法 , 仅 限 批量 学 习 规 则 . 


trainbfg BFGS 拟 牛顿 法 :每 一 步 选 代 需 要 较 大 的 计算 量 ,但 迭代 次 数 较 少 , 仅 限 批量 学 习 规则 . 


trainoss 一 步 共 扬 和 拟 牛 顿 组 合法 :由 共 辆 梯度 法 和 拟 牛顿 法 组 合 , 仅 限 批量 学 习 规 则 . 
trainlm Levenberg-Marquardt 法 :中 等 规模 网 络 的 最 快 学 习 算法 , 仅 限 批量 学 习 规 则 . 
trainbr Bayesian 规范 法 :Levenberg-Marquardt 法 的 修正 算法 , 仅 限 批量 学 习 规 则 . 


使 用 newff(A,B, (Cj ,trainfun) ,除了 需要 输 人 A,8B,(C) ,trainfun' 外 ,在 训练 的 过 程 
中 ,MATLAB 中 已 经 默认 了 一 些 过 程 参 数 ,如 果 需 要 修改 ,可 以 根据 需要 给 出 不 同 的 参 
数 . 常用 的 参数 见 表 13. 3. 


表 13.3 常用 参数 


MATLAB 参数 名 功 能 缺 省 (默认 ) 值 
net. trainParam. goal 最 小 二 乘 目 标 (22) 式 设 定 值 0 
net. trainParam. epochs 整 批 学 习 的 迭代 厂 f 限 | 10 | 
es en 
net. trainParam. show | 显示 中 间 结果 的 周期 . 25 
net. trainParam. Ir 整 批 学 习 中 的 学 习 效 率 & al 0. 01 
| | 采用 势能 学 习 规 则 traingdm 的 势能 率 , 即 
net. irainParam. mc 0.9 
| (23) 式 中 的 a 


例 6 给 定 4 组 学 习 数 据 为 输入 [一 1 一 1] 2 2;0 5 0 5], 理 想 输 出 [一 1 
一 1 1 1], 试 建立 一 个 2 层 前 向 神经 网 络 ,第 1 层 ( 隐 层 ) 由 3 个 神经 元 组 成 且 用 tansig 
函数 ,第 2 层 用 purelin 聘 数 , 学 习 规则 为 traingd， 
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解 ” 从 输入 数据 可 以 设 定 4=[ 一 1 2; 0 5J, 隐 层 和 输出 层 分 别 有 3 个 和 1 个 神 
经 元 ,因此 8 二 [3 1], 如 果 采 用 默认 的 参数 ,命名 li61. m 的 MATLAB 程序 为 : 


A=[—1 2;0 5]; 


B=[3 1]; 
net= newtf(A,B, {('tansig', 'purelin'} , 'traingd') ; 
p=[-1 -1 2 2;0 5 0 5]; 


t= [-1 -1 1 1; 
[Lnet,tr]= train(net,p,t); 
a 三 sim(net,p) 


计算 结果 为 : 


TRAINGD, Epoch 0/100, MSE 2.38926/0, Gradient 3.66676/1e 一 010 

TRAINGD, Epoch 25/100, MSE 0.913783/0, Gradient 1.48203/1e 一 010 
TRAINGD, Epoch 50/100, MSE 0.62024/0, Gradient 0.737598/1e— 010 
TRAINGD, Epoch 75/100, MSE 0.539988/0, Gradient 0.413475/1e—010 
TRAINGD, Epoch 100/100, MSE 0.513057/0, Gradient 0. 249464/1e 一 010 
TRAINGD, Maximum epoch reached, performance goal was not met. 

a= 一 3.7994e 一 002 一 9.1354e 一 001 一 3.8625e 一 002 7.9861e— 001 


可 以 看 出 ,计算 在 迭代 到 100 次 后 停止 ;平均 最 小 二 乘 误差 MSE 二 0. 513057, 距 默认 
值 0 尚 远 . 如 果 连 续 运 行程 序 , 权 数 逐 步 和 迭代 ,会 发 现 计算 结果 越 来 越 好 . 
为 了 比较 一 个 算法 的 计算 效率 ,需要 对 权 数 初始 化 ,可 以 采用 MATLAB 提供 的 命令 


net = init(net); 


它 保证 每 次 计算 开始 时 ,随机 产生 权 数 , 若 将 这 个 命令 加 到 上 面 的 程序 ,重复 运行 几 次 ,会 
发 现 计算 结果 不 是 越 来 越 好 . 
现 设 定 一 些 参数 ,命名 1i62. m 的 程序 为 : 


A=[—1 2;0 5]; 

B=[3 11; 

net= newff(A,B, {'tansig', ‘purelin'} ,'traingd') ; 
net = init(net) ; 

net. trainParam. show = 10; 

net. trainParam. Ir= 0.2; 

net. trainParam. mc= 0.8; 

net. trainParam. epochs= 50; 

net. trainParam. goal= 0.01; 

p=[-1 -1 2 2;0 5 0 65]; 
t=[-1 -1 1 1j; 
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[net,tr]= train(net, p,t); 
a = sim(net,p) 


计算 结果 为 : 

TRAINGD, Epoch 0/50, MSE 2.27506/0.01, Gradient 3.27134/1e~010 

TRAINGD, Epoch 10/50, MSE 0.00769866/0.01, Gradient 0.113776/1e 一 010 

TRAINGD, Performance goal met. 

a 王 一 1.1112e 二 000 一 9.28376e 一 001 1.0385et+ 000 8.91281e 一 001 

10 次 迭代 达到 预期 效果 . 重复 运行 上 面 的 程序 ,你 会 发 现 计 算 结 果 可 能 不 同 , 这 与 权 
数 的 随机 选取 有 关 . 


13.3.3 ”BP 算法 的 综合 应 用 示例 
例 7 用 图 13. 10 的 两 层 前 向 神经 网 络 产生 图 13. 11 的 理想 输出 . 


内 
1.0 
0.5 
| 
0 t 2 3 4 x 
图 13.10 6 个 神经 元 的 两 层 网 络 图 13.11 理想 输出 


学 习 数 据 如 表 13.4, 共 有 81 个 点 . 每 个 神经 元 的 激活 函数 都 采用 (24) 式 . 对 不 同 的 
学 习 算 法 比较 计算 的 效率 ,程序 中 的 trainfun 由 表 13. 2 中 的 函数 逐一 替代 . 除 设 定 欠 代 
次 数 上 限 .显示 和 迭代 轮 数 和 最 小 二 乘 目 标 值 上 限 外 ,其 他 参数 均 采用 默认 值 . 初始 权 数 的 
选取 具有 随机 性 ,每 一 个 训练 方法 重复 计算 5 次, 取 输 出 的 平均 值 . 
表 13.4 学 习 数 据 
输入 值 ， 输出 值 输入 值 输出 值 输入 值 输出 值 


.600 2. 900 0. 050 


-0175 2.950 0.025 


.525 3.050 0.025 


0 
0 
0.100 0.550 1.900 0.550 3. 000 0.000 
0 
0 


续 表 
输入 值 输出 值 输入 值 输出 值 输入 值 输出 值 
0. 950 0. 975 2.150 0. 425 3. 850 0. 425 
1. 000 1.000 2. 200 0. 400 3.900 0. 450 
1.050 0. 975 2. 250 | 0. 375 3.950 | 0. 475 
1. 100 0. 950 | | Er 4. 000 0. 500 


命名 为 li71.m 程序 如 下 ， 


atime 一 0; % 时 间 计 时 名 称 
aepoch=0; ””% 选 代 次 数 和 名称 
amse=0; . % 最 小 二 乘 目 标 值 名 称 
fori=1:5 % 和 迭代 5 次 

tic; % 计时 开始 


net=newff([0 4],[4 11, (logsig logsigy , ‘trainfun') ; % 用 表 1 的 函数 名 替代 :trainfun 
net=initCnet) ; 
P= [0 : 0.05 : 4]; 
fori=1:1:81 
if 0.05# (i—1)>=0&0.05x (i— DD)<=1 
TO) =0.5+0.5*0.05*# (~ 1); 
elseif 0.05x (i—1)>1&0.05*x (i—1)<=3 
TOD) =1/2x (—0.05 x (i—1)+3); 
elseif 0.05x (i—1)>3&0.05x (i—1)<=4 


TO)=1/2x (0.05 x* (i—1)—3); 

end 
end 
net.trainParam. show= 1000; 
net. trainParam. epochs= 3000; 
net. trainParam. goal = 0.005; 
[net,trj= train(net,P,T); 
time= time+ toc; 
[n1,n2]= size(tr. epoch); 
aepoch= aepoch+ tr. epoch(1,n2); 
[n3,n4]= size(tr. perf) ; 
epomse=tr. perf(1,n4); 
amse= amse+ epomse; 


end 


% 计算 的 中 间 结 果 参 数 用 tr 表示 
% 计时 累加 
% tr.epoch 表示 迭代 的 轮 数 


% tr. perf 表示 迁 代 的 每 一 轮 最 小 二 乘 目 标 函 数 的 值 
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time = time/5 
aepoch= aepoch/5 


amse= amse/5 


计算 结果 见 表 13. 5. 在 表 13. 5 和 下 面 的 表 13. 6 中 ,结果 1 表示 达到 不 超过 最 小 二 
乘 目标 设 定 值 的 要 求 ;结果 2 表示 达到 设 定 的 最 大 迭代 轮 数 上 限 3000; 结 果 3 表示 达到 
了 步 长 的 最 小 设 定 值 而 提前 终止 ;结果 4 表示 达到 设 定 最 小 梯度 值 而 提前 终止 ;结果 5 表 
示 达 到 设 定 最 大 均值 (结果 2 到 结果 5 都 没有 达到 不 超过 最 小 二 乘 目标 设 定 值 的 要 求 ); 

“x ”前 的 数字 表示 达到 该 结果 的 次 数 . 

从 表 13.5 可 以 看 出 ,对 于 本 示例 ,trainrp, traincgf,traincgb,trainscg,trainim 是 比较 
好 的 学 习 方法 . | 

实际 上 ,每 一 个 学 习 方 法 中 还 有 一 些 参数 可 以 人 为 调整 ,这 需要 大 量 的 模拟 计算 . 以 
本 例 的 traingdm 学 习 方法 为 例 ,可 以 调整 的 参数 有 势能 率 net. trainParam. mc 和 学 习 效 
率 net.trainParam.ir. 用 表 13. 4 数据 计算 10 次 的 平均 值 ,以 比较 这 两 个 参数 的 不 同 组 合 
对 结果 的 影响 . 可 将 171.m 简单 修改 得 到 这 两 个 参数 的 模拟 计算 程序 ,修改 的 内 容 包 括 : 
迭代 次 数 改 成 10 次 ;trainfun 以 traingdm 代入 ; 设 定 net. trainParam. mc 一 0. 9 和 net. 
trainParam. lr 二 0.01(0.9,0.01 可 调节 ), 并 加 入 在 net. trainParam.goal 二 0. 005 之 后 . 计 


算 结果 见 表 13, 6: 


表 13.5 各 种 训练 方法 的 $5 次 平均 计算 结果 


MATLAB | 平均 计算 时 间 ”| ”平均 迁 代 轮 数 | 平均 目标 值 
函数 名 (time)/s Caepoch) Camse) 村 并 全 下 的 届 生 

traingd 17. 49 3000.0 0.135495 | 5 结果 2 

traingdm 16.76 3000.0 0. 154739 | 5 结果 2 

traingdx 7.31 826.8 0.005462 | 4* 结果 1,1' 结果 2 

trainrp 2. 46 97. 4 0.004966 | 5 结果 1 

traincgf 3.31 188.4 0.004797 5' 结果 1 
traincgp 9. 91 649.8 0.007782 | 3* 结果 1,1* 结 果 2,1. 结 果 3 
traincgb 2.87 28.2 0.004659 | 5 结果 1 

trainscg 2.03 104.6 0.004683 | 5 结果 1 

trainbfg 2.15 92 0.006793 | 4' 结果 1,1' 结果 4 

trainoss 25. 85 1611.4 0.006259 | 3' 结果 1,2' 结果 2 

trainlm 5. 92 28 0.004251 | 5 结果 1 

trainbr 0.033352 | 5 "结果 5 
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表 13.6 不 同 参数 10 次 计算 结果 


多 层 前 向 神经 网 络 


平均 计算 时 间 平均 迭代 轮 数 平均 目标 值 

(time)/s (aepoch) (amse) 计算 终止 的 原因 
0.9,0.01 14. 68 ”3000 0.125525 10' 结果 2 
0.9,0.1 13.61 2777.8 0.010079 4" 结果 1,6' 结果 2 
0.9,0.5 10. 90 20595. 4 0. 008512 4' 结果 1,6' 结果 2 
0. .91 1725.5 0.007911 | 5° 结果 1,5' 结果 2 
0 2900.9 0.010935 2 ”结果 1,8' 结果 2 
0. 1916. 8 0. 006574 6" 结果 1,4' 结果 2 
0.5,1 13.11 | 2721.8 0.008474 2" 结果 1,8' 结果 2 
0.1,0.1 13. 82 2807.8 0.012222 2* 结果 1,8' 结果 2 
0.1,0.5 12.16 2397.9 0.008541 3" 结果 1,7' 结果 2 
0.1,1 8.94 1667.3 0.007138 4" 结果 1,6' 结果 2 


可 以 看 出 ,两 个 参数 的 选取 对 结果 影响 很 大 . 学 习 效 率 低 时 ,收敛 慢 , 造 成 迭代 轮 数 的 
增加 ;势能 系数 高 收敛 并 不 一 定 快 . 结果 显示 ,势能 系数 和 学 习 效 率 都 是 0. 5 时 ,效果 最 
好 . 若 采 用 traincgb 学 习 方法 ,默认 系数 ,最 小 二 乘 目 标 函 数值 上 限 取 0. 001, 经 过 学 习 
后 ,再 重新 将 表 13. 4 的 数据 输入 ,其 计算 结果 如 图 13. 12 所 示 . 其 中 实 线 图 形 为 理想 输 


出 ,“ 十 ”图 形 为 计算 结果 . 


1.0 


图 13.12 例 7 的 计算 输出 与 理想 输出 


前 向 多 层 神经 网 络 的 实际 应 用 包括 很 多 方面 ,如 手写 体 的 识别 .语音 识别 、 文 本 语音 


转换 .图 像 识 别 . 生 物 和 医学 信号 处 理 等 . 
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13.4 MATLAB 的 图 形 交 互 界面 


MATLAB 神经 网 络 工具 箱 提 供 了 图 形 交 互 界 面 ,省 去 了 编写 程序 的 繁琐 ,提高 了 程 
序 运 行 的 效率 . 调用 图 形 交 互 界面 的 命令 为 nntool, 运 行 后 ,出 现 界面 如 图 13. 13. 


Errors: oi YT 


图 13.13 神经 网 络 交 互 主 界面 


计算 一 个 新 算 例 时 , 单 击 New Data 按钮 ,建立 相应 的 输入 (Inputs)、 理 想 输 出 
(Targets) 等 数据 . 以 例 6 为 例 , 当 输入 [一 1 一 1 2 2;0 5 0 5] 后 , 单 击 Create 按 
钮 , 则 数据 存储 在 临时 数据 文件 datal 中 . 同样 ,理想 输出 的 输入 完毕 后 , 单 击 Create 按 
钮 , 则 数据 存储 在 临时 数据 文件 data2 中 . 单 击 New Networks 按钮 ,完成 网 络 结构 的 输 
入 ,如 图 13.14 所 示 . 

可 以 通过 光标 的 选择 ,建立 一 个 两 层 的 BP 算法 神经 网 络 ,第 1 层 ( 隐 层 ) 由 3 个 神经 
元 组 成 , 且 用 tansig 函数 ,第 2 层 用 purelin 函数 . 学 习 规 则 为 traingd. 单 击 Create 按钮 , 则 

网 络 结构 保存 在 networkl 数据 文件 中 . 当 光 标 在 networkl 的 位 置 时 ,可 以 通过 选择 
Initialize、Train 和 Simulate 等 键 完 成 网 络 的 初始 化 .训练 和 模拟 工作 .训练 后 的 神经 元 输 
出 和 与 理想 输出 的 偏差 计算 结果 分 别 保 存在 networkl_outputs 和 network1_errors 数据 
文件 中 . 在 训练 开始 ,可 以 通过 Training Parameters 选择 参数 . 单 击 Train Network 后 ， 
可 以 得 到 网 络 的 权 数 、 计 算 输 出 结果 .计算 输出 结果 与 理想 输出 的 偏差 等 . 可 以 通过 单 击 
相应 的 图 标 得 到 需要 的 数据 . 

将 光标 选中 相应 的 栏目 后 , 单 击 View 可 以 直接 观察 或 修改 数据 ,也 可 以 通过 Export 


13.5 和 神经 网 络 在 座 妄 诊断 中 的 应 用 


Network Name:|networkt 六 


rNetvwvork Type: [Eeed-forward backprop 


Input ranges: 1 2:051 人 Joet from inp... 


Training function: |TRAINGD 
Adaption learning fonction:; LEARNGDI 
Performance function: 

Number oflayers: 


Properties for |Layer : 


?|Number of neurons:1 


~ |ransfet Funcnon "| 


RE 


RE 


将 数据 传 到 MATLAB 工作 区 . . 

如 果 学 习 数 据 庞大 ,通过 界面 逐一 输入 非常 不 方便 ,可 以 将 输入 数据 和 理想 输出 数据 
按 要 求 格式 分 别 存储 在 自 定义 的 数据 文件 中 ,通过 交互 界面 的 Import 完成 输入 数据 和 理 
想 输出 数据 的 输入 . 


13.5 神经 网 络 在 话 妄 诊断 中 的 应 用 


利用 神经 网 络 方法 求解 这 个 问题 效果 怎样 ? 我 们 将 表 13. 1 中 的 1 一 40 号 数据 和 
59~96 号 数据 作为 学 习 数据 ,41 一 58 号 数据 作为 检验 数据 . 18 个 检验 数据 中 有 一 例 漏诊 
和 一 例 误诊 ,因此 可 以 比较 好 地 检验 神经 网 络 的 功效 . 
选用 极为 简单 的 2 层 且 隐 层 有 4 个 神经 元 的 BP 算法 神经 网 络 ,程序 zhanwang. m 
如 下 : 


+ M= dlmreadC'data1.moNtD ; % 从 datal.m 文件 中 读 取 数据 


A=zeros(78,11); % 由 于 表 13.6 第 一 列 序号 存在 数据 文件 中 ,因此 通 
过 程序 剔除 .A 和 矩阵 中 存储 学 习 数 据 
C= zeros(18,11) ; % CC 矩阵 存储 检验 数据 
for i=1 : 40 
for j=2: 12 


AlCi,j— 1)=M(i,); 
end 


end 
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for i=41 : 78 
for j=2 : 12 
ACi,j—1)=MC8+i,); 
end 
end 
for i=1:18 
for j=2 : 12 
CO,j— DD) =MC40+1,)); 
end 
- end 
A=A'; % 按 神 经 网 络 要 求 格式 书写 数据 算 阵 
C=0'; 1 
B=[4 1]; % 隐 层 、 输 出 层 分 别 有 4 个 和 1 个 神经 元 
T1= [ones(1,40) ,zeros(1,38)]; % 学 习 数 据 的 理想 输出 
net= newff(minmax(A) ,B, {'tansig', 'tansig') , 'traingdx') ; % 建立 网 络 结构 ,选取 学 习 规 则 
net= init(net) ; 
net. trainParam. show= 1000; % 设 定 一 些 控 制 参数 
net. trainParam. epochs= 4000; 
net. trainParam. goal=0.005; 


[net,tr] = trainC(net, A,T1); % 开始 训练 

a = sim(Cnet,C); % 对 检验 数据 开始 工作 

T2= [ones(1,8) ,zeros(1,10)]; % 检验 数据 的 理想 输出 

output1 = sum(round(a 一 T2)) % 以 0.5 作为 诊断 的 分 界 值 ,计算 诊断 错误 数 
= sim(net,A); % 对 学 习 数据 重新 开始 工作 

output2 = sum(round(b—T1)) % 以 0.5 作为 诊断 的 分 界 值 ,计算 诊断 错误 数 


其 中 datal. m 文件 中 存储 表 13. 1 中 的 后 96 行 . 前 12 列 的 数据 . 

重复 计算 5 次 , 共 18X5 检验 样本 的 诊断 错误 数 output1 累加 为 2, 即 检验 数据 中 出 
现 两 例 诊断 错误 ,诊断 错误 率 为 2/90 王 2. 2% ,这 已 经 大 大 降低 了 量 表 诊断 法 的 错误 率 . 
很 明显 ,只 要 算法 达到 预 置 的 net. trainParam. goal 一 0. 005 ,学 习 样 本 的 诊断 错误 数 
output2 一 定 为 0. 将 两 种 诊断 错误 累加 , 则 合计 96X5 样本 的 总 体 诊 断 错误 率 为 2/480 一 
0.004 二 0.4%. 如 果 将 所 有 的 数据 都 作为 学 习 样 本 ,只 需 如 example2. m 一 样 简单 地 设置 
过 程 参数 , 则 2 层 且 隐 层 有 4 个 神经 元 的 BP 算法 神经 网 络 可 以 保证 无 诊断 错误 . 

神经 网 络 所 涵盖 的 内 容 很 广泛 . 除 本 实验 介绍 的 内 容 外 ,还 有 竞争 学 习 、 自 组 织 学 
习 中 等 元 指导 学 习 的 前 向 神经 网 络 . 前 向 神经 网 络 非常 适合 应 用 在 识别 . 归 类 和 建立 因果 
参数 关系 等 问题 . 特别 是 那些 机 理 尚 不 清楚 的 领域 ,更 体现 出 神经 网 络 的 优越 性 . 

20 世纪 80 年 代 , Hopfield'*' 5 通过 模拟 电路 实现 了 反馈 型 人 工 神 经 网 络 的 功能 ,并 
成 功 地 应 用 到 组 合 优 化 问题 ,这 一 突破 使 得 人 工 神 经 网 络 成 为 新 的 研究 热点 . 对 人 工 神经 
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网 络 的 总 体 评价 可 以 归 为 以 下 几 个 方面 5 . 

第 一 ,提供 信息 处 理 的 一 种 新 的 手段 . 主要 归功 于 人 工 神经 网 络 的 自 适应 性 .学 习 能 
力 和 大 规模 的 平行 计算 能 力 .第 二 ,发 展 已 较为 成 熟 . 成 熟 的 3 个 方面 是 :模型 的 建立 和 数 
学 理论 的 支持 ,计算 工具 的 发 展 ,神经 生物 学 的 发 展 和 对 大 脑 的 认识 .第 三 ,人 工 神经 网 络 
发 展 仍然 受到 限制 .尽管 计算 机 技术 发 展 迅速 ,但 是 在 储存 、 速 度 和 用 户 柔 性 方面 的 非 适 
应 能 力 ,限制 了 人 工 神经 网 络 的 发 展 . 第 四 ,有 成 功 应 用 的 案例 . 人 工 神经 网 络 在 视觉 \ 语 
言 .信号 处 理 和 机 器 人 等 方面 有 成 功 应 用 的 示例 . 虽说 应 用 的 范围 有 限 , 但 其 应 用 的 领域 
及 效果 给 人 们 以 深刻 的 印象 . 

人 工 神经 网 络 的 模型 要 求 发 展 神经 网 络 型 计算 系统 来 蔡 代 传统 的 计算 机 . 这 种 计算 
系统 不 再 是 传统 计算 机 顺序 执行 命令 的 运行 过 程 ,而 是 希望 对 输入 进行 平行 处 理 ;不 再 是 
只 包含 一 个 或 几 个 复杂 的 计算 设备 ,而 是 由 众多 简单 设备 有 机 组 成 在 一 起 ;处 理 信息 时 ， 
不 再 是 将 信息 存储 在 一 个 精确 的 位 置 上 ,而 是 通过 神经 元 的 内 部 相连 关系 达到 信息 储存 
的 功能 . 在 目前 的 条 件 下 ,还 只 能 依赖 传统 的 计算 机 来 模拟 人 工 神经 网 络 的 这 些 功 能 . 数 
值 计算 和 分 析 是 模拟 中 的 一 个 重要 部 分 . 只 有 当 人 工 神经 网 络 硬件 系统 得 到 发 展 , 才 能 使 
目前 的 人 工 神经 网 络 更 快 , 更 有 效 地 解决 规模 更 大 的 实际 问题 ， 
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实验 目的 

1. 擎 握 前 向 神经 网 络 的 基本 概念 与 原理 ,及 用 MATLAB 实现 的 方法 ; 

2 全 全 人际 全 是 

实验 内 容 

1.“ 异 或 问题 (XOR)” 是 最 简单 的 逻辑 运算 之 一 ,两 个 逻辑 变量 zi ,zs 及 结果 y 的 运 
算 满 足 | 


试用 单 层 线性 网 络 ( 图 13. 15) 计算 ,分析 计 算 结 果 . 证 明 单 层 线性 网 络 无 法 实现 
XOR 的 计算 功能 . | 
2. 证 明 无 论 单 层 阶 路 网络 (图 13. 15) 中 的 权 数 和 阔 值 如 何 选 取 , 都 无 法 正确 模拟 
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XOR 问题 的 输入 输出 关系 . 

3. 两 层 前 向 神经 元 网 络 如 图 13..16 , 若 它 的 所 有 神经 元 的 激活 函数 采用 阶 跃 函数 , 权 
数 如 图 标定 ,每 个 神经 元 的 阐 值 为 0. 证 明 :该 神经 网 络 可 以 正确 模拟 XOR 问题 的 输入 输 
. 出 关系 . 


Xl WI 


Wy 


22 


图 13.15 异 或 问题 网 络 图 13.16 模拟 XOR 问题 的 神经 网 络 


4. 试用 单 层 Sigmoid 前 向 神经 网 络 (图 13.15) 计 算 求 解 XOR 问题 ,并 分 析 计 算 
5. 一 个 自 适应 滤波 系统 可 以 同时 处 理 6 个 信号 ,每 个 输入 信号 的 范围 为 [1，30] , 若 
依次 收 到 时 滞 为 1 的 信号 (1，5，10，15，20，25，30，25，20，15} ,其 的 理想 输出 为 
{10,20,30,40,50，60,70，70,，70,，70}, 假设 初始 系统 信号 为 Lz(0),z( 一 1),z( 一 2)， 
Xx( 一 3) ,zx( 一 4)] 二 [5,4,3,2,1], 试 用 神经 网 络 模拟 这 个 系统 . 

6. 试用 一 个 两 层 的 BP 神经 网 络 系统 模拟 sin(z) (0 委 z 委 2x). 分 析 比 较 隐 层 神经 元 
不 同 的 个 数 , 不 同 的 学 习 方 法 ,不 同 的 控制 参数 组 合 对 计算 结果 的 影响 . 

7. 对 13. 5 节 诺 妄 诊断 问题 ,讨论 隐 层 神经 元 的 个 数 对 计算 结果 的 影响 . 

8. 寻找 一 些 实际 问题 的 数据 ,应 用 神经 网 络 方法 ,解决 和 分 析 这 些 问题 . 
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数学 建 模 与 数学 实验 


在 前 面 的 每 个 实验 中 我 们 都 是 首先 提出 几 个 简化 的 实际 问题 ,建立 它们 的 数学 模型 ， 
介绍 求解 这 一 类 模型 的 某 种 数学 方法 和 相应 的 软件 ,最 后 给 出 这 些 问题 的 数学 结果 


然后 
并 给 以 适当 的 解释 . 作为 数学 建 模 与 数学 实验 的 综合 应 用 ,这 个 实验 将 给 出 几 个 稍微 复杂 
一 点 的 实际 问题 及 其 数学 模型 ,它们 的 求解 要 用 到 前 面 不 止 一 个 实验 中 介绍 的 内 容 . 


14.1 投篮 的 出 手 速度 和 角度 


14.1.1 问题 的 提出 


. 在 激烈 的 篮球 比赛 中 ,提高 投篮 命中 率 对 于 获胜 无 疑 起 着 决定 作用 ,而 出 手 角 度 和 出 
手 速 度 是 决定 投篮 能 否 命 中 的 两 个 关键 因素 . 这 里 讨论 比赛 中 最 简单 .但 对 于 胜 负 也 常常 
是 很 重要 的 一 种 投篮 方式 一 一 罚球 ,并 且 球 出 手 后 不 考虑 自身 的 旋转 ,不 考虑 碰 篮 板 或 

图 14. 1 为 过 罚球 点 P 和 篮 管 中 心 Q 且 垂直 于 地 面 的 平面 示意 图 ,按照 标准 尺寸 ， 
已 和 Q 点 的 水 平 距 离 工 = 4.60m,Q 点 的 高 度 百 = 3.05m, 篮球 直径 d = 24. 6cm, 篮 
惫 直径 D 二 45. 0cm. 不 妨 假定 篮球 运动 员 的 出 手 高 度 户 为 1.8 一 2. 1m, 出 手 速度 "为 
8.0 一 9. 0m/s. 试 建立 数学 模型 研究 以 下 问题 : 

(1) 先 不 考虑 篮球 和 篮 德 的 大 小 ,讨论 球 心 命中 复 心 的 条 件 . 对 不 同 的 出 手 高 度 h 和 
出 手 速 度 v 确定 出 手 角 度 和 球 人 篮 乱 处 的 人 射 角 度 8. 

(2) 考虑 篮球 和 篮 介 的 大 小 ,讨论 球 心 命中 管 心 且 球 人 人 香 的 条 件 . 检查 上 面 得 到 的 出 
手 角度 c 和 和 人 射 角度 8 是 否 符合 这 个 条 件 . 

(3) 为 了 使 球 人 复 , 球 心 不 一 定 要 命中 管 心 ,可 以 偏 前 或 偏 后 ( 球 心 命 中 图 14. 1 中 的 
Qi 或 QQ 点 ). 讨论 保证 球 人 管 的 条 件 下 ,出 手 角度 允许 的 最 大 偏差 ,和 出 手 速 度 允 许 的 最 
大 偏差. 

(4) 考虑 空气 阻力 的 影响 . 由 于 投篮 基本 上 是 水 平方 向 且 速 度 不 大 的 室内 运动 ,可 以 
只 计 水 平方 向 的 阻力 , 设 阻力 与 速度 成 正比 ,比例 系数 有 不 超过 0. 05(1/s). 


L 1 


图 14,1 从 罚球 点 投篮 示意 图 


14.1.2 问题 的 分 析 


(1) 不 考虑 篮球 和 篮 翁 大 小 的 简单 情况 ,相当 于 将 球 视 为 质点 ( 球 心 ) 的 斜 抛 运动 . 将 
坐标 原点 定 在 球 心 已 , 列 出 zx( 水 平 ) 方 向 和 y ( 竖 直 ) 方 向 的 运动 方程 ,就 可 以 得 到 球 心 的 
运动 轨迹 .于 是 球 心 命中 德 心 的 条 件 可 以 表示 为 出 手 角度 与 出 手 速度 .出 手 高 度 之 间 的 关 
系 , 以 及 球 和 人 篮 翁 处 的 入射 角度 与 出 手 角 度 的 关系 ,由 此 可 对 不 同 的 出 手 速 度 和 出 手 高 
度 ,计算 出 手 角 度 和 人 射 角度 . 

(2) 考虑 篮球 和 篮 能 的 大 小 时 ,如 图 14. 2, 篮球 直径 为 d, 篮 乱 直 径 为 D. 显然 ,即使 
球 心 命中 公心 , 若 和 人 射 角 8 太 小 , 球 会 磁 到 管 的 近 侧 A, 不 能 入 管 . 由 图 14. 2 不 难得 出 B 
应 满足 的 、 球 心 命中 做 心 且 球 入 做 的 条 件 .前面 计算 结果 中 不 满足 这 个 条 件 的 ,当然 应 该 
去 掉 . , 

(3) 球 人 仅 时 球 心 可 以 偏离 公心 , 偏 前 (图 14.1 的 Q 点) 的 最 大 距离 为 图 14. 3 中 的 
Azx,Ax 可 以 从 入 射 角 8 算出 ,根据 Az 和 球 心 轨迹 中 >z 与 a 的 关系 ,能 够 得 到 出 手 角度 a 
允许 的 最 大 偏差 Aa. 出 手 速度 v 允许 的 最 大 偏差 Av 可 以 类 似 地 处 理 

(4) 考虑 水 平方 向 的 空气 阻力 时 ,应 该 用 微分 方程 求解 球 心 的 运动 轨迹 ,由 于 阻力 很 
小 ,可 作 适 当 简化 . 然后 与 前 面 类 似 地 作 各 种 计算 . 


图 14.2 篮球 入 管 图 14.3 球 心 偏 前 


14.1 投篮 的 出 手 速 度 和 角度 


14.1.3 基本 模型 


(1) 不 考虑 篮球 和 篮 人 复 大 小 ,不 考虑 空气 阻力 的 影响 ,以 未 出 手 时 的 球 心 P 为 坐标 原 
点 工 轴 为 水 平方 向 ,> 轴 为 竖 直 方向 ,篮球 在 1 二 0 时 以 出 手 速度 v 和 出 手 角度 e 投 出 ,可 
视 为 质点 ( 球 心 ) 的 斜 抛 运动 ,其 运动 方程 为 


X(t) = vtcosa, y(t) = vtsing — gt /2, (1) 
其 中 g 是 重力 加 速度 . 由 此 可 得 球 心 运动 轨迹 为 如 下 抛物 线 
y= rtang— xg/(2v cosa), (2) 


以 xz 二 上 L,y 二 及 一 h 代入 (2) 式 ,就 得 到 球 心 命中 黎 心 的 条 件 
ta 一 于 | 圭一 至 (一 5 | (3) 


可 以 看 出 ,给 定 出 手 速 度 v 和 出 手 高 度 h, 有 两 个 出 手 角 度 a 满足 这 个 条 件 .而 (3) 式 有 解 
的 前 提 为 


2 人 
| 有 0 (4) 


1 一 从 (Hh+ 


”可 解 得 
v 之 gL[H—h+ vi + Ho ]. (5) 

于 是 对 于 一 定 的 出 手 高 度 h, 使 (5) 式 等 号 成 立 的 v 为 最 小 出 手 速 度 vnis, 它 是 的 减 
函数 . 1 
由 (3) 式 计算 出 的 两 个 出 手 角 度 记 作 wm ,az , 且 设 w >az ,可 以 看 出 ,a 是 疡 和 = 的 增 
函数 . 

思考 “van 是 六 的 减 函数 ,w 是 六 和 v 的 增 函 数 ,能 作出 实际 解释 吗 ? as 与 h 和 vw 的 
关系 又 怎样 呢 ? 

(2) 球 人 篮 艇 处 的 入射 角度 8 可 从 下 式 得 到 


a , (6) 


5 dz zl 
这 里 的 导数 由 (2) 式 计算 代入 后 可 得 
tanp = tana 一 2 (7) 


于 是 对 应 于 Ql,az, 有 BisyBs, 设 Bi 之 Be. 
思考 ”ai ,az 会 小 于 零 吗 ? 8 ,BB 会 小 于 零 吗 ? 如 果 小 于 零 作 何 解释 ? 
(3) 考虑 篮球 和 篮 管 的 大 小 ,如 图 14.2, 若 人 射 角度 68 太 小 , 则 球 无 法 入 黎 . 由 图 不 难 
看 出 , 球 心 命中 复 心 且 球 人 复 的 条 件 为 
sinp > a/D. (8) 


S00 


Se 
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将 4 二 24. 6cm,D= 二 45. 0cm 代入 得 p>33.1. 


14.1.4 出 手 角度 和 出 手 速度 最 大 偏差 估计 


由 图 14. 3 看 出 , 球 人 惫 时 球 心 可 以 偏 前 ( 偏 后 与 偏 前 一 样 ) 的 最 大 距离 Az 为 
Az 一 DD a 
2 2sinB 
为 了 得 到 出 手 角 度 允 许 的 最 大 偏差 Aa, 可 以 在 (3) 式 中 以 工 土 Az 代替 工 重新 计算 ,但 是 
由 于 Az 中 包含 B, 从 而 也 包含 a, 所 以 这 种 方法 不 能 解析 地 求 出 Au. 
如 果 从 (2) 式 出 发 并 将 y= 及 一 h 代入 ,可 得 
2Z2g/(2uozcos:au) — rtang+ HO—h=0. (10) 


对 a 求 导 并 令 z 二 L, 就 有 


(9) 


dz i L(v’ 一 gLtana) 
dali-r gL — vsinacosa 


用 Ax/Aa 近似 代替 左边 的 导数 , 即 可 得 到 出 手 角度 的 偏差 Ac 与 Az 的 如 下 关系 


_ Lv sinacosa 
eg Llv a 12) 


由 Au 和 已 经 得 到 的 ga 也 容易 计算 相对 偏差 | Aa/al. 
类 似 地 ,(10) 式 对 vw 求 导 并 令 工 二 工 ,可 得 出 手 速度 允许 的 最 大 偏差 


_ gL — vsingcosa 


(11) 


Am vAx. (13) 
gL 
由 (12) 式 和 (13) 式 v 的 相对 偏差 为 
Av| vy? I 
a 一 As 过 tana ) 。 (14) 


14.1.5 空气 阻力 的 影响 


按照 篮球 运动 的 特点 可 以 只 考虑 水 平方 向 的 阻力 , 且 阻 力 与 速度 成 正比 ,比例 系数 为 
&. 这 时 水 平方 向 的 运动 由 微分 方程 
工 十 妈 二 0， 
[0 二 0， (15) 
Xx(0) = wcosa 
描述 ,其 解 为 
X(t) = vcosa(]1 一 e 4 )/R， (16) 
因为 阻力 不 大 (RE 委 0.05(1/s) ) ,时 间 也 很 小 ( 约 1s) ,所 以 将 (16) 式 中 的 e 天 作 泰勒 展开 
后 忽略 二 阶 以 上 项 得 到 (不 考虑 竖 直 方向 的 阻力 , 故 y(2) 仍 与 (1) 式 相同 ) 


X(t) = vicosa — vkticosa/2, y(t) = vising — gt’/2. (17) 


在 不 考虑 篮球 和 篮 黎 大 小 时 , 球 心 命中 黎 心 的 条 件 由 方程 组 


确定 . 


vicosg — vkticosa/2—L = 0, 


14.1.6 算法 实现 和 计算 结果 


(1) 对 不 同 出 手 高 度 的 最 小 出 手 速 度 和 相应 的 出 手 角 度 


14.1 投篮 的 出 手 速 度 和 角度 


vtsing— gt*/2— (HC—h)=0 (18) 


使 (5) 式 等 号 成 立 的 v 为 最 小 出 手 速度 vwin ,在 这 个 速度 下 由 (3) 式 可 得 相应 的 出 手 


角度 ao 为 


tamnawo 


= v/egL. 


取出 手 高 度 h==1. 8m~2. 1m, 计 算 结 果 见 表 14. 1， 


表 14.1 对 不 同 出 手 高 度 的 最 小 出 手 速度 和 相应 的 出 手 角 度 


(19) 


(2) 对 不 同 出 手 速 度 和 出 手 高 度 的 出 手 角 度 和 入 射 角度 


h/m Umin /m/sS ao/C) 

1.8 7. 6789 52. 6012 
1.9 7. 5985 52.0181 
2.0 7.5186 51. 4290 
2:1 7.4392 50. 8344 


对 出 手 速 度 vw 二 8., 0my/s 一 9. 0mys 和 出 手 高 度 h 二 1. 8m 一 2. 1m, 册 (3) 式 计算 出 手 角 


度 CIyC2， 由 (7) 式 计算 人 射 角度 有 ,pz ;结果 见 表 14. 2. 
表 14.2 对 不 同 出 手 速度 和 出 手 高 度 的 出 手 角度 各 入射 角 度 


v/m/s h/m oa/C) az/() B/C) B/C 
1.8 62. 4099 42. 7925 53. 8763 20. 9213 
1.9 63.1174 40. 9188 55, 8206 20. 1431 
2.0 63.7281 39. 1300 57. 4941 19. 6478 
2.1 64. 2670 37. 4017 58. 9615 19. 3698 
= F | | 有 
1.8 67.6975 37. 5049 62. 1726 12. 6250 
1.9 68. 0288 36. 0075 63. 1884 12,7753 
全 2.0 68. 3367 34. 5214 64. 1179 13. 0240 
2.1 | 68. 6244 33. 0444 64. 9729 13. 3583 | 
os 


363 ， 
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续 表 
v/m/s h/m a./(") ua/(?) B/C°) B/C) 
1.8 71. 0697 34. 1327 67. 1426 7. 6550 
1.9 71. 2749 32. 7614 67.7974 . 8. 1663 
> 2.0 71.4700 31. 3881 68. 4098 8.7321 
2.1 71. 6561 30. 0127 68. 9840 9.3472 


可 以 看 出 ,BB 均 小 于 33.1°, 不 满足 (8) 式 的 条 件 , 所 以 在 考虑 篮球 和 篮 他 大 小 的 实际 
情况 下 ,出手 角度 只 能 是 a. 

(3) 出 手 角度 和 上 出手 速 度 的 最 大 偏差 

利用 (12) 式 和 上 面 的 a ,计算 出 手 角 度 最 大 偏差 Aa 和 Aa/a, 再 用 (13) 式 和 (14) 式 计 
算出 手 速度 的 最 大 偏差 Av 和 Av/v; 只 将 h 二 1. 8m, 2. 0m 的 结果 列 人 表 14. 3. 


表 14.3 ”出手 角 度 和 出 手 速 度 最 大 偏差 


1.8 


h/m a/(°) v/m/s Aa Av | Aa/a| | Av/v| 
62. 4099 8.0 一 0.7562 0. 0528 1. 2261 0.6597 
| 
67. 6975 8.5 一 0. 5603 0. 0694 0. 8276 0.8167 
71,.0697 9.0 一 0.4570 0.0803 0.6431 0. 8925 
63.7281 8.0 一 0.7100 0. 0601 1. 1140 0. 7511 
68. 3367 ”8.5 一 0. 5411 0. 0734 0.7918 0.8640 
71. 4700 9.0 一 0. 4463 0.0832 0.6244 0. 9243 


(4) 空气 阻力 的 影响 


设 空气 阻力 系数 &=0.05(1/s) ,对 出 手 速度 vv 二 8. 0m/s 一 9. 0m/s 和 出 手 高 度 hh 二 
1.8m 一 2. Im, 由 (18) 式 计算 出 手 角度 . (18) 式 是 非 线性 方程 组 ,可 用 MATLAB 的 fsolve 


求解 : 


function f=qiuCxv,g,k,H,h，,) 
fC1)=vx xC1) x x(2) —kxvxx(1) * x(2)°2/2—1; 
fC(2)=vx sqrt(1— x(1)°2) x x(2) ~— gx* x(2)°2/2— (H~—h); 


g=9.8;k=0.05;H=3.05;| 三 4.6; 
x0=[0.4 1]; 
fori=1:3 

v(i)=8+ (i—1)*0.5; 


% x(1)=cosa, x(2)=t 


% 根据 不 考虑 阻力 的 结果 选取 x 的 初 值 


14.1 投篮 的 出 手 速 度 和 角度 3 


for j=1:4 
hj) =1.8+0—1)*0.1; 
x=fsolve(@qiu,x0,[] ,vi) ,gk,H,h()) ,D); 
al(i,j) = acos(x(1)) * 180/pi; 


al 即 为 出 手 角 度 Qi. 如 取 初 值 x0= 二 [0.7,1], 得 到 az. 计算 结果 见 表 14. 4( 将 不 考虑 
阻力 的 结果 重 写 在 最 后 两 列 , 以 作 比 较 ). 


表 14.4 考虑 空气 阻力 时 的 出 手 角度 


考虑 空气 阻力 不 考虑 空气 阻力 
vw/m/s h/m cs 
a1/(") az/(°) a1/() az/(°) 

1.8 . 60.7869 43. 5424 62. 4099 42.7925 

1.9 61. 6100 41. 5693 63. 1174 40. 9188 
8.0 

2.0 62. 3017 39.7156 63.7281 - 39. 1300 

2 62. 9012 37. 9433 64. 2670 37. 4017 

1.8 66.5719 37.7905 67.6975 37. 5049 

1.9 66. 9244 36. 2870 68. 0288 36.0075 
8.5 上 

2.0 67. 2505 34.7982 68.3367 34.5214 

— 下 > 
2.1 67.5541 33. 3209 68. 6244 33. 0444 
ep a! 

1.8 70. 1198 34. 2736 71.0697 34. 1327 

1.9 70.3328 上 32. 9087 71. 2749 32.7614 
9.0 i Rl 

2.0 70. 5352 .31. 5428 71. 4700 31. 3881 

2.1 70.7279 | 30. 1756 71. 6561 30. 0127 


思考 ”如 何 计算 入 射 角 p, 并 由 此 判断 出 手 角度 ws 是 否 应 该 舍 去 . 


14.1.7 结果 分 析 


(1) 最 小 出 手 速 度 和 出 手 角度 ( 表 14. 1) 

对 应 于 最 小 出 手 速度 是 最 小 出 手 角度 ,它们 均 随 着 出 手 高 度 的 增加 而 略 有 减少 ;出 手 
速度 一 般 不 要 小 于 8m/s. 

(2) 出 手 速度 和 出 手 高 度 对 出 手 角 度 的 影响 ( 表 14. 2) 
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速度 一 定时 ,出 手 高 度 越 大 ,出 手 角度 应 越 大 ,但 是 随 着 速度 的 增加 ,高 度 对 角度 的 影 
响 变 小 ,这 种 影响 在 1" 左 右 ;出 手 高 度 一 定时 ,速度 越 大 ,出 手 角 度 也 应 越 大 ,速度 的 影响 
在 7*~g" . 

(3) 出 手 角 度 和 出 手 速度 的 允许 偏差 ( 表 14. 3) 

总 的 看 来 ,允许 偏差 都 相当 小 . 进一步 分 析 可 知 ,出 手 高 度 一 定 ,速度 越 大 ,角度 的 允 
许 偏差 越 小 ,而 速度 的 允许 偏差 越 大 , 且 对 角度 的 要 求 比 对 速度 的 要 求 严 格 ;出 手 速 度 一 
定 , 高 度 越 大 ,虽然 也 是 角度 的 允许 偏差 越 小 ,速度 的 允许 偏差 越 大 ,但 这 时 对 角度 和 速度 
的 要 求 都 相对 较 低 . 

(4) 空气 阻力 的 影响 ; . 

对 同样 的 出 手 速 度 和 高 度 ,考虑 阻力 影响 时 出 手 角度 要 大 一 些 (1 一 2 人)， 

还 可 将 空气 阻力 的 影响 与 前 面 讨论 的 命中 偏 前 (后 ) 的 允许 偏差 作 一 对 比 . 由 (17) 式 
可 知 , 阻 力 对 z(7) 的 影响 为 因子 (1 一 kt/2), 因 为 k= 二 0. 05(1/s),zszlsG 可 由 fsolve 的 
zx(2) 得 到 ) ,所 以 阻力 对 命中 偏 前 (后 ) 的 影响 不 超过 3%; 而 由 (9) 式 允许 偏差 Az 约 为 
0.09m(86 以 65" 计 ), 与 7 二 4. 6m 的 相对 偏差 约 2 为 ,二 者 是 相当 的 . 

思考 ” 若 出 手 高 度 和 角度 固定 ,考察 阻力 对 出 手 速度 的 影响 . 


14.2 降落 伞 的 选择 


14.2.1 问题 的 提出 


为 向 灾区 空投 救灾 物资 共 2000kg, 需 选 购 一 些 降 落 伞 .已 知 空投 高 度 为 500m, 要 求 
降落 伞 落 地 时 的 速度 不 能 超过 20m/s. 降落 伞 面 可 视 为 半径 -的 半球 面 , 用 每 根 长 ! 共 16 
根 绳索 连接 着 载重 m, 示 意图 如 图 14. 4. 

每 个 降落 伞 的 价格 由 3 部 分 组 成 . 企 面 价格 由 伞 半 径 ~ 决定 
〈 表 14. 5); 绳 索 每 米 4 元 ;其 他 费用 200 元 . 

降落 全 在 降落 过 程 中 受到 空气 的 阻力 ,为 了 确定 阻力 的 大 
小 ,用 半径 3m、 载 重 300kg 的 降落 企 从 500m 高 度 作 降落 试验 ， / 

测 得 各 时 刻 的 高 度 ( 表 14. 6)， 上 

试 确定 降落 伞 的 选 购 方案 , 即 共 需 多 少 个 ,每 个 企 的 半径 多 

大 (在 表 14. 5 中 选择 ) ,在 满足 空投 要 求 的 条 件 下 ,使 费用 最 低 . 
表 14.5 降落 企 伞 面 价格 
半径 >/m 2 2.5 3 3.5 4 


图 14.4 降落 伞 示 意图 


费用 /元 65 170 350 660 1000 
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表 14.6 降落 试验 的 时 刻 上 和 高 度 x 


zm | 500 | 470 


14.2.2 问题 的 分 析 


这 是 一 个 有 约束 的 优化 问题 . 目标 函数 是 降落 伞 的 总 费用 ,为 了 实用 上 的 方便 ,不 妨 
只 选 一 种 规格 ( 们 半径 ) 的 降落 企 ,于 是 总 费用 是 降落 企 的 个 数 与 每 个 降落 们 价格 的 乘积 ， 


而 决策 变量 是 降落 伞 数 量 ( 记 作 2 和 每 个 伞 的 半径 r. 虽然 n 和 r 都 只 能 取 有 限 多 个 离散 ， 


值 ,但 是 ,对 n 和 + 的 各 种 组 合 进行 枚 举 计算 ,逐个 验证 是 否 满足 约束 条 件 .比较 费用 ,是 
相当 繁琐 的 ,并 且 缺 乏 一 般 性 . 我 们 宁可 先 将 n 和 7 看 作 连 续 变 量 , 建 立 优化 模型 , 求 得 
优 解 后 ,再 按 题目 要 求 作 适当 调整 . 
约束 条 件 主 要 是 例 的 落地 速度 不 能 超过 20m/s, 为 表述 这 一 条 件 需 要 建立 并 求解 降 
. 落 例 速度 满足 的 微分 方程 ,而 方程 中 的 重要 参数 一 一 空气 阻力 系数 一 一 又 要 通过 测量 数 
据 ( 表 14. 6) 作 拟 合 得 到 . 显然 ,由 于 测量 数据 是 时 间 与 高 度 , 所 以 需要 找 出 速度 与 高 度 之 
间 的 关系 . 
确定 费用 函数 的 关键 是 找 出 伞 面 价格 与 伞 半 径 的 关系 , 它 可 以 根据 所 给 数据 ( 表 14. 5) 
. 用 适当 的 函数 来 拟 合 , 观 察 这 些 数据 的 散 点 图 ,用 短 函 数 拟 合 比较 合适 . 
建立 降落 伞 下 落 的 微分 方程 时 ,关键 是 对 所 受阻 力 的 分 析 ,显然 , 阻 力 随 着 降落 速度 
和 爹 面 积 的 增加 而 变 大 . 


14.2.3 模型 假设 


(1) 爹 面 价格 c: 与 们 半径 ~ 的 关系 ,用 才 函 数 c 一 a 六 Ca， 0 为 待定 参数 ) 按 照 表 14. 5 


数据 来 拟 合 ;载重 m 位 于 球 心 正 下 方 球面 处 ,每 根 绳 索 的 长 度 /二 V27. 
(2) 降落 伞 在 空中 只 受到 向 下 的 重力 和 向 上 的 空气 阻力 的 作用 ,阻力 与 降落 速度 和 
们 面积 的 乘积 成 正比 ,阻力 系数 用 表 14. 6 数据 作 拟 合 ;降落 们 初速 为 零 . 


14.2.4 模型 建立 
(1) 目标 函数 二 个 降落 伞 的 总 费用 , 记 作 C. 每 个 降落 们 的 费用 由 伞 面 价格 c= 
a 几 ,绳索 价格 c: 一 4X16XV2r 一 90. 5r 和 其 他 费用 cs 二 200 组 成 ,于 是 
C 一 mc 十 cs 十 cs) 一 mar* 十 90.5r 十 200)， (20) 


(2) 全 的 速度 和 高 度 ” 记 时 刻 t 例 的 速度 为 v(t) ,高 度 为 z(?) ,空气 阻力 为 kr*w， 


a 
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dz 2 

1 -一 一 18 一 Rr VD . 

| dt - (21) 
v(0) 一 0， 
其 中 m= 二 2000/n( 一 个 降落 爹 的 载重 ),g= 二 9. 8m/s. 方 程 (21) 的 解 为 
_ 2000g kr°n 
全 (1 exp 0 (22) 
对 速度 函数 积分 ,并 注意 到 :==0 时 x 二 500, 得 到 例 的 高 度 zx(2) 为 
. 2000g，，20002g 1 _ krin 

CT (1 ~ exp(— 26007)) 人 


(3) 约束 条 件 “降落伞 落 地 速度 不 超过 20m/s, 即 当 (23) 式 的 x 二 0 时 解 得 的 根 i, 代 
人 (22) 式 后 满足 v(t) 二 20. 此 外 还 有 z 之 1,2 委 r 委 4 的 附加 条 件 . 
整个 优化 模型 可 记 作 
minC = n(ar’* + 90. 5r + 200) 


2000g. ，2000?g kr n 
s. t. 500 ttt (1 exp( 20007) )= 0 


2000g/，_ _ hkrin 
li exp( 2000) )< 20， 
n 之 l]，2 达 rr 碌 4. (24) 
当 参 数 a, b,& 用 所 给 数据 拟 合 确定 后 , 即 可 求解 模型 (24) 得 到 n, r( 实 数值 ) ,然后 再 作 
14. 2.5 模型 求解 
(1) 参数 估计 
.a， 上 的 估计 ; 先 将 c= 二 ar 转化 为 Incl 二 Ina 十 blnr, 然 后 对 于 表 14. 5 数据 用 线性 最 
小 二 乘法 和 MATLAB 软件 编程 : 
r=[2 2.5 3 3.5 4]; 


cl=[65 170 350 660 1000]; 
lgc1l= log(c1) ;lgr= log(r); 


A= polyfit(lgr,1gc]1 .21); 
b=A(1);a= exp(A(2)); 
rr=2:0.01:4;cc1l=axrr.°b; 
plotlr,c1,'+ ',rr,cc1) ,grid 


得 到 a=4.3039 b =3.9779 
与 数据 的 拟 合 效果 见 图 14. 5. 下 面 取 4a=4.3, 6 一 4. 
k 的 估计 : 用 表 14. 6 数据 估计 ,注意 到 作 降 落 试 验 时 nn 二 1,m 二 300 ,r 一 3, 于 是 
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(23) 式 应 改 为 


z= 500— 1 + £(1—exp(— 3B!)). (25) 


由 表 14. 6 数据 利用 MATLAB 软件 作 非 线性 最 小 二 乘 拟 合 ,编程 ; 


function {= sanf Ck ,t) 
f=500—980 x t/3/k+98000 * (1—expC(—3*kxt/100))/9/k’2; 


t=[0 3 6 9 12 15 18 21 24 27 30]; 
x= [500 470 425 372 317 264 215 160 108 55 1j; 
k0= 10; 
k= Ilsqcurvefit( @ sanf, Kk0 ,t,x), 

. tt=0:0.1:30; 
f=500~—980x tt/3/k+98000* (1—expC~—3x*kxtt/100))/9/k°2; 
plotCt,x,'+ ,tt,f) ,grid 


得 到 
k=18.4583 
与 数据 的 拟 合 效 果 见 图 14. 6. 下 面 取 二 18. 5. 
1200 : 500 
1000 400 
800 
300 
600 
200 
400 
200 100 
57 2.5 3.0 3.5 4.0 0 5 10 15 20 25 30 
图 14.5 由 表 14.5 数据 拟 合 参 数 a,b 图 14.6 由 表 14.6 数据 拟 合 参数 


(2) 优化 模型 求解 
. 将 参数 估计 得 到 的 a 二 4.3, 6 二 4, & 一 18.5 代 人 优化 模型 (24) ,用 MATLAB 的 优 
化 工具 箱 求 解 ， 


function c= sanc(x) % 目标 函数 ,x(1)=n,x(2)= 
C=xC1) * (4.3 x x(2)°“4+90.5* x(2) + 200); 


function [cc,cceq] = sancc(x) % 约束 条 件 ,x(3) = 
k=18.5; 

p= 19600/k/x(1) /x(2)°2; 

qd= 1 expC—kxx(C1) * x(2)°2 x x(3)/2000); 
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cc=px q—20; % 不 等 式 约束 

cceq=500—pxx(3)+p"2 x q/9.8; % 等 式 约 束 

x0=[3,4,30]; % x 的 初 值 

v=[1,2,0]; % x 的 下 界 

u=[10,4,50]; % x 的 上 界 

[x,c]=fmincon(@sanc,x0,.[],[],[j,[L],v,u, @sancc) 
得 到 


x= 6.0072 2.9695 27.0408 
C = 4.8245e 十 003 


根据 题目 要 求 ,将 结果 调整 为 * 一 6,r 一 3， 即 选 购 6 个 降落 伞 , 每 个 半径 为 3m. 

(3) 结果 验证 . 

对 于 调整 后 的 结果 n 二 6,r 二 3, 验证 落地 速度 是 否 不 超过 20m/s. 为 此 , 先 由 (23) 式 
求解 非 线 性 方程 : 


_ 2000g, , 2000'g/, /hrin 
0 0 re ep 


再 将 得 到 的 上 代 和 人 (22) 式 计算 出 落地 速度 ,编程 : 
function ff= sany(t,k,n,r) 
p= 19600/k/n/r2; 
q=1—exp(—kxnxr2xt/2000); 
ff=500~pxtt+p°2 x q/9.8; 


k=18.5;nN=6;r= 3; 

10= 30; 

t= fzero( @sany,t0,[ |] ,k,n,r) 

p= 19600/k/n/r2; 

d= 1—expC(—kxnxr2xt/2000); 


v=p*q 
得 到 

t = 27.4867 v = 19.6196 

落地 速度 符合 要 求 . 


最 后 ,按照 (20) 式 计算 总 费用 (其 中 c, 用 实际 价格 350 元 ) ,得 到 
C= 6X(350 二 +90.5X3 十 200) = 4920( 元 ). 
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14.3 航空 公司 的 预订 票 策略 


14.3.1 问题 的 提出 


在 激烈 的 市 场 竞争 中 ,航空 公司 为 争取 更 多 的 客 源 而 开展 的 一 个 优质 服务 项 目 是 预 
订 票 业务 . 公司 承诺 ,预先 订购 机 票 的 乘客 如 果 未 能 按时 前 来 登 机 ,可 以 乘坐 下 一 班机 或 
退票 ,无需 附加 任何 费用 . 当然 也 可 以 订 票 时 只 订 座 , 登 机 时 才 付 款 , 这 两 种 办 法 对 于 下 面 
的 讨论 是 等 价 的 . 

开展 预订 票 业务 时 ,对 于 一 次 航班 , 若 公 司 限制 预订 票 的 数量 恰好 等 于 飞机 的 容量 ， 
那么 由 于 可 能 会 有 一 些 订 了 机 票 的 乘客 不 按时 前 来 登 机 ,致使 飞机 因 不 满员 飞行 而 利润 
-降低 ,甚至 亏本 . 而 如 果 不 限 制 预订 票数 量 ,那么 当 持 票 按时 前 来 登 机 的 乘客 超过 飞机 容 
量 时 ,必然 会 引起 那些 不 能 飞 走 的 乘客 的 抱怨 ,公司 不 管 以 什么 方式 补偿 ,也 会 导致 声誉 
受 损 和 一 定 的 经 济 损失 ,如 客 源 减少 , 挤 掉 以 后 班机 的 乘客 ,公司 无 偿 供应 食 宿 , 付 给 一 定 
的 赔偿 金 等 . 所 以 航空 公司 需要 综合 考虑 经 济 利益 和 社会 声誉 ,确定 预订 票数 量 的 最 佳 
限额 . 
假设 能 够 得 到 一 些 诸如 飞机 容量 .机 票 价格 .飞行 费用 、 对 被 挤 掉 者 的 赔偿 金 等 数据 ， 
以 及 由 统计 资料 估计 的 乘客 不 按时 前 来 登 机 的 概率 ,请 建立 一 个 数学 模型 ,给 出 衡量 公司 
经 济 利益 和 社会 声誉 的 指标 ,对 预订 票 业务 确定 最 佳 的 预订 票数 量 ， 

考虑 不 同 客 源 的 实际 需要 ,如 商业 界 、 文 艺 界 人 士 喜 欢 上 述 这 种 无 约束 的 预订 票 业 
务 ,他们 宁愿 接受 较 高 的 票 价 ,而 不 按时 前 来 登 机 的 可 能 性 较 大 ;游客 及 准时 上 下 班 的 雇 
员 ,会 愿意 以 不 能 按时 前 来 登 机 则 机 票 失效 为 代价 ,换取 较 低 额 的 票 价 . 航空 公司 为 降低 
风险 ,可 以 把 后 一 类 乘客 作为 基本 客 源 , 对 他 们 降低 票 价 , 但 购 票 时 即 付款 ,不 按时 前 来 登 
机 则 机 票 作废 . 根据 这 种 实际 情况 ,制订 更 好 的 预订 票 策略 . 


14.3.2 问题 的 分 析 


把 持 预订 票 按时 前 来 登 机 ,但 因 满 员 不 能 飞 走 的 乘客 称 为 被 挤 掉 者 ,公司 要 付 给 他 们 
一 定 的 赔偿 金 ,并 且 被 挤 掉 者 数量 的 增加 将 导致 公司 声誉 降低 . 
公司 的 经 济 利益 可 以 用 机 票 收 入 扣除 飞行 费用 和 赔偿 金 后 的 利润 来 衡量 ,社会 声誉 
可 以 以 被 挤 掉 者 的 人 数 限制 在 一 定数 量 为 标准 ,这 是 个 两 目标 的 优化 问题 ,需要 合理 地 将 
它 转化 为 单 目 标 优化 . 问题 的 决策 变量 是 预订 票数 量 的 限额 . 
这 个 问题 的 关键 因素 在 于 预订 票 的 乘客 中 有 多 少 人 按时 前 来 登 机 ,显然 这 是 随机 的 ， 
所 以 经 济 利益 和 社会 声誉 两 个 指标 都 应 该 在 平均 意义 下 衡量 . 
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14.3.3 模型 假设 


(1) 飞机 容量 为 常数 ,机 票 价格 为 常数 g, 飞行 费用 为 常数 r,r 与 乘客 数量 无 关 ( 实 
际 上 关系 很 小 ) ,机 票 价格 按照 g 一 ~/(Az) 来 制订 ,其 中 人 (<1) 是 利润 调节 因子 ,如 1 一 0.6 
表示 飞机 60% 满 员 率 就 不 亏本 . 

(2) 预订 票数 量 的 限额 为 常数 m( 之 n), 且 m 张 票 已 经 订 出 ;每 位 乘客 不 按时 前 来 登 
机 的 概率 为 p, 各 位 乘客 是 否 按 时 前 来 登 机 是 相互 独立 的 ,这 适合 于 单独 行动 的 商人 、 游 
客 等 . 

(3) 公司 付 给 每 位 被 挤 掉 者 的 赔偿 金 为 常数 b. 


14.3.4 ”模型 建立 


(1) 公司 的 经 济 利 益 用 同一 航线 多 次 航班 的 平均 利润 S 来 衡量 ,S 等 于 每 次 航班 利 
润 的 期 望 . 每 次 航班 的 利润 s 是 机 票 收 入 中 扣除 飞行 费用 和 可 能 发 生 的 赔偿 金 . 当 m 位 
乘客 中 有 位 不 按时 前 来 登 机 时 


(m—k)g—r, m—k<n, 
5 一 | (27) 
mn —r—(m knb, m=k > Nh 
由 假设 (2) ,不 按时 前 来 登 机 的 乘客 数 KK 服从 二 项 分 布 ,于 是 概率 


pr > P{K mm k} 3 (ip de k= 0,1,.…,m, 人 一 二 一 办， (28) 
平均 利润 S 为 | 
1T 一 9 一 上 


SC(m = 2) [ng on mk—mblpt [lm—k)g—rlpe. (29) 
k=0 ‘ 


化 简 (29) 式 ,并 注意 到 》 kp = mp 可 得 
Som) i (m—k—n)p. (30) 
当 ”， gf,，r，, p 给 定 后 可 以 求 n 使 SC(m) 最 大 . 

(2) 公司 从 维护 社会 声誉 考虑 ,应 该 要 求 被 挤 掉 的 乘客 不 要 太 多 ,而 由 于 被 挤 掉 者 的 
数量 是 随机 的 ,可 以 用 被 挤 掉 的 乘客 数 超过 若干 人 的 概率 作为 度量 指标 . 记 被 挤 掉 的 乘客 
数 超过 ;7 人 的 概率 为 P;(m) ,因为 被 挤 掉 的 乘客 数 超过 7 人 ,等 价 于 m 位 预订 票 的 乘客 中 
不 按时 前 来 登 机 的 不 超过 光一 xn 一 j 一 1 人 ,所 以 


m—1-J—1 


Pm = 2) pi. (31) 


P;《m) 单 调 增加 . 


.14.3 航空 公司 的 预订 票 策略 


综 上 ,SClm) 和 了 P;(m) 虽 然 是 这 个 优化 问题 的 两 个 目标 ,但 是 可 以 将 P;(m) 不 超过 某 
个 给 定 值 作为 约束 条 件 , 以 SC(m) 为 单 目标 函数 来 求解 . 


14.3.5 模型 求解 


为 了 减少 SC(m) 中 的 参数 , 取 SC(m) 除 以 飞行 费用 7 为 新 的 目标 函数 J(m), 其 含义 是 
单位 费用 获得 的 平均 利润 ,注意 到 假设 1 中 有 g 王 7/ (4n) ,由 (30) 式 可 得 


， m—n—l 


S 6 
Jom) = 2 和 [am (1+ 之 ) > Cm—k~—n)ps |—1, (32) 
其 中 b/g 是 赔偿 金 占 机 票 价格 的 比例 . 问题 化 为 给 定 A4,，n, p, b/g; 求 m 使 J(m) 最 大 ,而 


约束 条 件 为 


Pj(m) = 2) Pe (33) 
其 中 a 是 小 于 1 的 正 数 . 
模型 (32) , (33) 无 法 解析 地 求解 ,我 们 设 定 几 组 数据 ,用 MATLAB 软件 作 数 值 计 算 ， 
结果 如 下 . 
设 2 一 300 1 一 0.6， p=0., 05,0.1,， b/g 二 0.2,0.4, 计 算 J lm) ,Ps (m) ,Pio《m), 得 
表 14. 7. 


表 14.7 PP 一 300,p 一 0.05 和 0.1, 1 一 0.6,p/8g 一 0.2 和 10.4 的 计算 结果 


p=0.05 p=0.1 
m J J 
ER | Ps Pio | Ps Pio 
b/g=0.2 | 6/g=0.4 b/g=0.2 | b/g=0.4 
| | 
300 0. 5833 | 0. 5833 0 0 | 0. 5000 | 0.5000 0 0 
302 0.5939 | 0.5939 0 0 0.5100 | 0..5100 0 0 
六 一 
304 0. 6044 | 0.6044 0 | 0 0.5200 | 0.5200 0 0 
306 0. 6150 | 0.6150 | 0.0000 0 0.5300 | 0.5300 | 0.0000 0 
| | | 
308 0.6254 | 0.6254 | 0.0000 0 0. 5400 | 0.5400 | 0.0000 0 
| Er 
SEE ES 
310 0. 6353 | 0.6351 | 0.0007 0 0.5500 | 0.5500 | 0.0000 0 
312 0. 6439 | 0.6434 | 0.0066 | 0.0000 | 0.5600 | 0.5600 | 0.0000 | 0.0000 
三 和 袜 引 机 王 直 2 es 
314 0.6503 | 0.6492 | 0.0341 | 0.0002 | 0.5700 | 0.5700 | 0.0000 | 0.0000 
" 
316 0.6540 | 0.6517 | 0.1123 | 0.0023 | 0.5800 | 0.5800 | 0.0000 | 0.0000 
318 0.6551 | 0.6512 | 0.2612 | 0.0160 | 0.5899 | 0.5899 | 0.0001 | 0.0000 
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14.3.6 结果 分 析 


(1) 对 于 所 取 的 各 个 n,p,b/g ;平均 利润 J m) 随 着 m 的 变 大 都 是 先 增加 再 减少 ,但 
是 在 最 大 值 附近 变化 很 小 ,而 被 挤 掉 的 乘客 数 超过 5 人 和 10 人 的 概率 Ps (m) 和 Pio 《m) 
增加 得 相当 快 ,所 以 应 该 参考 J(m) 的 最 大 值 ,给 定 约束 条 件 (33) 式 中 可 以 接受 的 a, 确定 
合适 的 m. | 

(2) 对 于 一 定 的 n, Pp, 当 b/g 由 0.2 增加 到 0.4 时 ,J(m) 的 减少 不 超过 2%, 所 以 不 
妨 付 给 被 挤 掉 的 乘客 以 较 多 的 赔偿 金 :说 得 社会 声誉 . 

(3) 综合 考虑 经 济 效 益 和 社会 声誉 ,可 给 定 Ps 《m)< 过 0.2, Pio(m) 二 0.05, 由 表 14.7， 
车 估计 p= 二 0.05, 取 mx 二 316; 车 估计 pp 二 0.1, 取 mm 二 330( 表 中 黑体 字 的 行 ). 


14.3.7 预订 票 策略 的 改进 
把 乘客 分 成 两 类 ,对 第 一 类 实施 上 述 的 预订 票 业务 ;对 第 二 类 降低 票 价 , 购 票 时 付款 ， 


14.4 实验 练习 


不 按时 前 来 登 机 则 机 票 作废 . 
设 预订 票数 量 m 中 有 上 张 是 专门 预 售 给 第 二 类 乘客 的 ,其 折扣 票 价 为 8(8<<1), 当 

m 一 t 位 第 一 类 乘客 中 有 & 位 不 按时 前 来 登 机 时 ,每 次 航班 的 利润 * 为 
_ libg + (m—t— kg—r, m—k<n, 


5 三 (34) 
thg tn—t)g—r—m—k—nb, m—k>n.. 
& 位 乘客 不 按时 前 来 登 机 的 概率 为 
pr = Ce prg” tt, k=0,l,…,m—t, g=1—p. (35) 
平均 利润 S 为 
m—n—l1 
SC(m) = > [iBg + Cn—ig—r—(m—k—nbop 
天 一 0 - 
十 >， [iBg + (m—it—k)g—rip 
£=m—n 
ml 
=gmg —r— (g++06) > (m—k—nmp— (ll—p8— pitg. (36) 
k=1 
正常 票 价 g, 折扣 票 价 Bg, 利润 调节 因子 与 飞行 费用 > 间 的 关系 为 
alipg + (nel]=r. (37) 
于 是 ,单位 费用 获得 的 平均 利润 为 


m—n— 


1 
J lm) = (1—B8— pt— (1+6/g) 2) Cm—k—mpe |—1. 
k=0 


1 | em 
A[n— (1— Bi] 
(38) 
约束 条 件 一 一 被 挤 掉 的 乘客 数 超过 7 人 的 概率 P; Cm) 不 变 ((31) 式 ). | 
取 8=0.75,: 一 50,100，150, 其 他 参数 同上 ,计算 结果 表明 , 当 上 增加 时 ,了 (mm) 和 
Pi(Cz) 均 有 所 减少 . 


14.4 实验 练习 


实验 目的 

综合 利用 学 过 的 数学 知识 ,分 析 , 解 决 几 个 简化 的 实际 问题 ,锻炼 和 检验 数学 建 模 的 
能 力 . | 

实验 内 容 


1. 影院 座位 设计 | 

图 14. 7 为 影院 的 剖面 示意 图 ,座位 的 满意 程度 主要 取决 于 视角 和 仰角 8. 视角 a 是 
观众 眼睛 到 屏幕 上 、 下 边缘 视线 的 来 角 ,a 越 大 越 好 ;仰角 8 是 观众 眼睛 到 屏幕 上 边缘 视 
线 与 水 平 线 的 夹 角 ,8 太 大 使 人 的 头 部 过 分 上 仰 ,引起 不 舒适 感 ,一般 要 求 8 不 超过 30 . 


3 
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记 影 院 屏 幕 高 h, 上 边缘 距 地 面 高 全, 地 板 线 倾角 0, 第 一 排 和 最 后 一 排 座位 与 屏幕 
水 平 距 离 分 别 为 4 和 也 ,观众 平均 坐 高 为 c( 指 眼睛 到 地 面 的 距离 ). 已 知 参 数 h=1. 8， 
太 =5, d 二 4.5, DD 二 19, c= 二 1, 1( 单 位 ;mm). 
(1) 设 地 板 线 倾角 9 二 10", 问 最 佳 座位 在 什么 地 方 . 
(2) 求 地 板 线 倾角 0( 一 般 不 超过 20") ,使 所 有 观众 的 平均 满意 程度 最 大 . 
“(3) 地 板 线 设计 成 什么 形状 可 以 进一步 提高 观众 的 满意 程度 . 


一 一 一 二 二 


地 板 线 


图 14.7 影院 剖面 示意 图 


2， 铅 球 掷 远 

铅球 掷 远 比 赛 的 场地 是 直径 2. 135m 的 圆 ,要 求 运动 员 从 场地 中 将 7. 257kg( 男 子 ) 重 
的 铅球 投掷 在 45" 的 扇形 区 域内 ,如 图 14. 8. 观察 运动 员 比 赛 的 录像 发 现 ,他 们 的 投掷 角 
度 变 化 较 大 ,一般 在 38" 一 45", 有 的 高 达 55", 试 建立 模型 讨论 以 下 问题 : 

(1) 以 出 手 速 度 : 出 手 角度 .出手 高 度 为 参数 ,建立 铅球 掷 
远 的 数学 模型 . 

(2) 给 定 出 手 高 度 ,对 于 不 同 的 出 手 速度 ,确定 最 佳 出 手 角 
度 . 比较 掷 远 结果 对 出 手 速度 和 出 手 角度 的 灵敏 性 . 

(3) 考虑 运动 员 推 铅球 时 用 力 展 臂 的 动作 ,改进 上 面 的 模型 ， 图 14.8 第 2 题 图 

3. 血样 的 分 组 检验 ; 

在 一 个 很 大 的 人 群 中 通过 血样 检验 普查 某 种 疾病 ,假定 血样 为 阳性 的 先 验 概率 为 p 
(通常 p 很 小 ). 为 减少 检验 次 数 ,将 人 群 分 组 ,一 组 人 的 血样 混合 在 一 起 化 验 . 当 某 组 的 
混合 血样 呈 阴 性 时 , 即 可 不 经 检验 就 判定 该 组 每 个 人 的 血样 都 为 阴性 ;而 当 某 组 的 混合 血 
样 呈 阳性 时 , 则 可 判定 该 组 至 少 有 一 人 血样 为 阳性 ,于 是 需要 对 这 组 的 每 个 人 再 作 检验 ， 

(1) 当 p 国定 时 (如 0.01%,…,0.1%,…,1%,…) 如 何 分 组 , 邑 多 少 人 一 组 ,可 使 平 
均 总 检验 次 数 最 少 , 与 不 分 组 的 情况 比较 . 

(2) 当 p 多 大 时 不 应 分 组 检验 . 

(3) 当 p 固定 时 如 何 进行 二 次 分 组 ( 即 把 混合 血样 星 阳 性 的 组 再 分 成 小 组 检验 ,重复 
一 次 分 组 时 的 程序 )， | 


2.135m 
rs 
Cn 
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(4) 讨论 其 他 分 组 方式 ,如 二 分 法 (人 群 一 分 为 二 ,阳性 组 再 一 分 为 二 ,继续 下 去 ) .三 
分 法 等 . 

4. 飞行 管理 (1995 年 全 国 大 学 生 数 学 建 模 竞赛 A 题 ) 

在 约 10000m 高 空 的 某 边 长 为 160km 的 正方 形 区 域内 ,经 常 有 若干 架 飞 机 作 水 平 飞 
行 . 区 域内 每 架 飞 机 的 位 置 和 速度 向 量 均 由 计算 机 记录 其 数据 ,以 便 进 行 飞行 管理 . 当 一 
架 欲 进 和 人 该 区 域 的 飞机 到 达 区 域 边 缘 时 ,记录 其 数据 后 ,要 立即 计算 并 判断 是 否 会 与 区 域 
内 的 飞机 发 生 碰 接 , 如 果 会 碰撞 , 则 应 计算 如 何 调整 各 架 ( 包 括 新 进入 的 ) 飞 机 飞行 的 方向 
角 , 以 避免 碰撞 , 现 假定 条 件 如 下 : 

。 不 碰撞 的 标准 为 任意 两 架 飞 机 的 距离 大 于 8km; 

。 飞机 飞行 方向 角 调 整 的 幅度 不 应 超过 30"; 

。 所 有 飞机 飞行 速度 均 为 每 小 时 800km; 

。 进入 该 区 域 的 飞机 在 到 达 该 区 域 边缘 时 ,与 区 域内 飞机 的 距离 应 在 60km 以 上 ; 

。 不 必 考 虑 飞机 离开 此 区 域 后 的 状况 . 

请 你 对 这 个 避免 碰撞 的 飞行 管理 问题 建立 数学 模型 , 列 出 计算 步骤 ,对 表 14. 8 数据 
进行 计算 (方向 角 误差 不 超过 0. 01") ,要 求 飞机 飞行 方向 角 调整 的 幅度 尽量 小 . 

设 该 区 域 4 个 顶点 的 坐标 为 :60,0),(160,0),(160,160), (0,160). 


表 14.8 记录 数据 
飞机 编号 横 坐 标 X 纵 坐 标 工 方向 角 /C) 
1 150 140 243 
2 85 85 236 
3 150 155 220.5 
4 145 50 | 159 
5 130 150 230 
新 进入 二 0 | 0 :> 总 


注 : 方向 角 指 飞 行 方向 与 X 轴 正 向 的 夹 角 . 

5. 水 塔 流 量 估计 (1991 年 美国 大 学 生 数学 建 模 竞 赛 A 题 ) 

某 居民 区 有 一 个 供 庆 民 日 常用 水 的 水 塔 , 它 是 一 个 高 12, 2m、 直 径 17. 4m 的 正 圆 柱 . 
按照 设计 , 当 水 塔 水 位 下 降 到 设 定 的 最 低 水 位 ( 约 8. 2m) 时 ,水 泵 自动 启动 向 水 塔 供水 ; 当 
水 位 上 升 到 设 定 的 最 高 水 位 ( 约 10. 8m) 时 水 泵 停止 供水 . 在 水 泰 工作 的 这 段 时 间 内 无 法 
测量 水 塔 的 水 位 和 水 泰 的 供水 量 .通常 水 泵 每 天 供水 一 两 次 ,每 次 约 两 小 时 . 

表 14. 9 是 某 一 天 水 塔 的 水 位 测量 记录 (符号 // 表示 水 泵 启动 ), 试 由 此 估计 任何 时 
刻 ( 包 括 水 泵 正在 供水 时 ) 从 水 塔 流出 的 水 流量 ,及 一 天 的 总 用 水 量 ， 


0 
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表 14.9 


时 刻 /h 0 0.92 | 1.84 | 2.95 | 3.87 | 4.93 | 5.90 | 7.01 | 7.93 | 8.97 
水 位 /em 968 948 931 913 898 | 881 869 | 852 839 822 
时 刻 /h 9.98 | 10.92 | 10.95 | 12.03 | 12.95 | 13.88 | 14.98 | 15.90 | 16.83 | 17.93 
”水 位 /em // // | 1082 | 1050 | 1021 | 994 | 965 | 941 | 918 | 892 
时 刻 /h 19.04 | 19.96 | 20.84 | 22.01 | 22.96 | 23.88 | 24.99 | 25.91 
水 位 /cm 866 | .843 822 涉 // 1059 | 1035 | 1018 


6. 彩票 中 的 数学 (2002 年 全 国 大 学 生 数 学 建 模 竞赛 B 题 ) 

近年 来 “彩票 照 风 ?席卷 中 华 大 地 ,巨额 诱惑 使 越 来 越 多 的 人 加 入 到 “彩民 ”的 行列 ,月 
前 流行 的 彩票 主要 有 “传统 型 *" 和 “ 乐 透 型 ”两 种 类 型 . 

“传统 型 "采用 “10 选 6 十 1” 方 案 : 先 从 6 组 0~9 号 球 中 摇 出 6 个 基本 号 码 ,每 组 摇 出 
一 个 ,然后 从 0~4 号 球 中 摇 出 一 个 特别 号 码 , 构 成 中 奖 号 码 . 投注 者 从 0 一 9 这 10 个 号 码 
中 任 选 6 个 基本 号 码 ( 可 重复 ) ,从 0 一 4 中 选 一 个 特别 号 码 ,构成 一 注 ,根据 单 注 号 码 与 中 
奖 号 码 相 符 的 个 数 多 少 及 顺序 确定 中 奖 等 级 . 以 中 奖 号 码 “abcdef 十 g” 为 例 说 明 中 奖 等 


级 ,如 表 14. 10(X 表 示 未 选中 的 号 码 ). 


表 14.10 
10 选 6 十 1(6 十 1/10) 
中 奖 等 级 OO -一 
` 基 本 号 码 特别 号 码 说 明 
一 等 奖 | abcdef 到 选 7 中 (6 十 1) 
二 等 奖 | abcdef | 选 ?7 中 (6) 
三 等 奖 | abcdex x bedef : 选 7 中 (5) 
四 等 奖 |abcdXX Xbcdex X X cdef 选 7 中 (4) 
五 等 奖 |abcXXX  XbcddxXx Xxedex XXXdef 选 7 中 (3) 
六 等 奖 abxXxXxx XbcxxXxx 久久 cd 久久 XxXxxdex XXXXef 选 7 中 (2) 


“ 乐 透 型 "* 有 多 种 不 同 的 形式 ,比如 “33 选 7 的 方案 : 先 从 01 一 33 个 号 码 球 中 一 个 一 
个 地 抒 出 7 个 基本 号 ,再 从 剩余 的 26 个 号 码 球 中 摇 出 一 个 特别 号 码 . 投注 者 从 01 一 33 个 
号 码 中 任 选 7 个 组 成 一 注 ( 不 可 重复 ), 根 据 单 注 号 码 与 中 奖 号 码 相 符 的 个 数 多 少 确 定 相 
应 的 中 奖 等 级 ,不 考虑 号 码 顺 序 . 又 如 “36 选 6 十 1” 的 方案 , 先 从 01 一 36 个 号 码 球 中 一 个 
一 个 地 播 出 6 个 基本 号 ,再 从 剩 下 的 30 个 号 码 球 中 摇 出 一 个 特别 号 码 . 从 01 一 36 个 号 码 
中 任 选 ?个 组 成 一 注 ( 不 可 重复 ) ,根据 单 注 号 码 与 中 奖 号 码 相 符 的 个 数 多 少 确定 相应 的 
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中 奖 等 级 ,不 考虑 号 码 顺 序 . 这 两 种 方案 的 中 奖 等 级 如 表 14. 11. 


表 14.11 

中 奖 33 选 7(7/33) ”6 选 641(641/36) 

等 级 | 基本 号 码 特别 号 码 | 说 明 基本 号 码 特别 号 码 说 明 
一 等 奖 | @@@@@@@@@ 选 ? 中 (7) OOOGOC 友 选 7 中 (6 十 1) 
二 等 奖 | @@@@G@O 丸 | 过 7 中 (6+1) | @@@eee 选 ? 中 (6) 
三 等 类 | @@e@eeecO 选 7 中 (6) eee@eeO 女 “| 选 7 中 (5 二 1) 
四 等 奖 | @@@e@eOO 太 | 选 ?中 6+D | @@@@@O 选 7 中 (5) 
五 等 奖 | @@@@@OO 选 7 中 (5) | @@@@BOO 六 | 选 ?中 (4 十 1) 
六 等 奖 | @O@@OOO 丸 | 选 ? 中 (4+D | @@@e@eOO - 选 7 中 (4) 
七 等 奖 | @@9@OOO 选 7 中 (4) @@eOOO 妇 | 选 7 中 (3 二 1) 


注 : 千 为 选中 的 基本 号 码 ; 丰 为 选中 的 特别 号 码 ; 〇 为 未 选中 的 号 码 . 


以 上 两 种 类 型 的 总 奖金 比例 一 般 为 销售 总 额 的 50% ,投注 者 单 注 金额 为 2 元 , 单 注 
若 已 得 到 高 级 别 的 奖 就 不 再 兼 得 低级 别 的 疾 . 现在 常见 的 销售 规则 及 相应 的 奖金 设置 方 
案 如 表 14. 12 ,其 中 一 、 二 、 三 等 奖 为 高 项 奖 ,后 面 的 为 低 项 奖 . 低 项 奖 数额 固定 ,高 项 奖 按 
比例 分 配 ,但 一 等 奖 单 注 保底 金额 60 万 元 ,封顶 金额 500 万 元 ,各 高 项 奖 额 的 计算 方 
法 为 : 

[当期 销售 总 额 X 总 奖金 比例 ) 一 低 项 奖 总 额 ]X 单 项 奖 比 例 

(1) 很 据 这 些 方案 的 具体 情况 ,综合 分 析 各 种 奖项 出 现 的 可 能 性 、 奖 项 和 奖金 额 的 设 
置 以 及 对 彩民 的 吸引 力 等 因素 评价 各 方案 的 合理 性 . 

(2) 设计 一 种 “更 好 ”的 方案 及 相应 的 算法 ,并 据 此 给 彩票 管理 部 门 提出 建议 . 

(3) 给 报纸 写 一 篇 短文 , 供 彩 民 参 考 . 


表 14.12 
Es 奖项 | 一 等 奖 | 二 等 奖 二 
方案 比例 /% | 比例 /%| 比 例 /%. 金额 /元 金额 /元 | 金额 /元 金额 /元 
1 6 十 1/10 50 | 20 Es 50 按 序 
2 6+1/10 60 | 20 20 | 300 20 按 序 


| 


3 6 十 1/10 65 


15 


20 


ee 


380 


实验 14 数学 建 模 与 数学 实验 


姜 启 源 , 谢 金 星 , 叶 俊 .数学 模型 .第 三 版 . 北京 : 


参考 文献 
姜 启 源 , 何 青 ,高 立 . 数学 实验 . 北京 : 高 等 教育 出 版 社 ,1999 


高 等 教育 出 版 社 ,2003 


续 表 
序号 奖项 | 一 等 奖 | 二 等 奖 | 三 等 奖 | 四 等 奖 | 五 等 奖 | 六 等 奖 | 七 等 奖 备 注 
方案 比例 /% | 比例/% | 比例 /% | 金额 /元 | 金额 /元 | 金额 /元 金额 /元 
6 6+1/29 60 25 15 200 20 
7 7/30 65 15 20 500 50 5 
8 7/30 70 10 20 200 50 5 
9 7/30 75.| 10 15 200 30 10 5 
10 7/31 60 15 25 500 50 20 10 
11 7/31 75 10 15 320 30 5 
12 7/32 65 15 20 500 50 10 
13 7/32 70 10 20 500 50 10 
14 7/32 75 10 .| 15 500 50 10 
15 7/33 70 10 20 600 60 6 
16 7/33 75 10 15 500 50 加 | 10 5 
17 7/34 65 15 20 500 30 6 
18 7/34 68 12 20 500 50 10 2 
19 7/35 70 15 15 300 50 5 
20 | 7/35 70 10 20 500 | 100 30 | 5 | 
21 7/35 75 10 15 | 1000 | 100 50 | 8 
22 | 7/35 80 10 10 200 50 20 5 
23 7/35 100 | 2000 | 20 4 2 无 特别 号 
24 6 十 1/36 75 10 15 500 | 100 10 We 
25 6 二 1/36 80 10 10 500 | 100 10 
26 7/36 70 10 20 500 50 10 5 
27 7/37 70 15 
28 6/40 
于 5/60 


Huntley I D, James D J] G, Mathematical Modelling: A Source Book of Case Studies. London: 
Oxford University Press, 1990 
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实验 1 


2. (1) 商品 的 价格 c= 二 aw 十 Bw 十 yY (ga,B,Y 为 大 于 0 的 常数 ). 

(2) 单位 重量 价格 c==a 十 Bw 十 yw !,，c 是 w 的 减 函数 , 且 曲 线 是 下 凸 的 ,实际 意 
义 从 略 ， 

3. (1) 将 时 间 分 为 3 段 :1790 一 1880 年 平均 增长 率 为 2.83%/ 年 ;1890 一 1960 年 平 
均 增长 率 为 1.53%/ 年 ;1970 一 2000 年 平均 增长 率 为 1. 12 吧 /年 . 3 段 模型 为 (1790 年 为 ; 
二 0, 1800 年 为 t= 二 1,2,…): zi (1t) 二 3. ge (t= 0,1,2,.,10), z(t) 一 
ZT1 (10)er 10 (4=11,12,.,18) ,zx3(t) = zr (18) e218 (一 19,20,21)， 

(2) 可 以 用 实际 增长 率 数 据 中 前 5 个 的 平均 值 作 为 固有 增长 率 ~, 取 某 些 专家 的 估计 
400( 百 万 ) 为 最 大 容量 zx, ,以 1790 年 的 实际 人 口 为 ze, 模 型 为 (24) 式 ， 


Xo 


4. 注意 到 1 二 时 z 一 zn/2 即 得 , 且 一 二 In 宇 一 < 
3 0 


5. 学 =r(z, ~ ) ,为 比例 系数 ,x(0) 二 zo, 解 为 (二 zm 一 (zm 一 To0)e “(图 略 ). 


6. 鱼 的 重量 ww 二 如 ,其 中 /为 身长 ,& 为 比例 系数 ;或 者 w= 二 kad?1， 2 d 为 胸围 ， 
为 比例 系数 . 利用 数据 估计 系数 可 得 二 0. 0146 ,如 一 0.0322， 

”7 了. 淋 雨 量 
1192 士 必 


3 VA Us, 
亿 


QD = A oiealsltolw Do 
4( 守 和 +1)， Vv Ur. 


其 中 g 二 alwuy| 十 blu; | ,图 从 略 ， 
8. (1) f(t) 的 图 形 以 (二 ， 去 ) 为 中 心 对 称 . 图 从 略 . 


(2) 甲 公司 利润 为 p(x) 一 ef (证 5 ) 一 zwe 是 常数 . 求 p(z) 最 大 值 点 有 多 种 图 解法 . 


St 
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_ 实验 2 


1. 要 用 11 年 7 个 月 才能 还 清 . 如 果 10 年 还 清 , 每 月 还 1111 元 . 

2. 70 岁 零 8 个 月 时 将 钱 用 完 , 如 果 想 用 到 80 岁 ,60 岁 时 应 存 15. 4 万 元 . 

3. 要 用 441 天 即 14 个 月 21 天 才能 达到 环保 要 求 . 若 要 1 年 内 达到 环保 要 求 ,河水 
中 污 物 浓度 应 降低 到 0. 008g/m’. | | 

4. 凶杀 案 发 生 在 凌晨 2 时 . 

5. (2) 在 3 种 环境 下 捕获 3 只 的 情况 下 ,最 终 会 灭绝 . 捕获 1 只 , 较 好 的 情况 下 会 逐 
步 上 升 ,其 他 情况 下 灭绝 . (3)2.7 只 . 

6. (1) 设 zi 为 加 州 第 年 人 口 数 ,zi4i 二 民 十 71 一 Qi)xt 十 Q, 其 中 出 生 率 x 用 1708/ 
12988 估计 ,死亡 率 di 用 614/12988 估计 ,迁移 Q 用 1124 估计 ,或 Q=qzey 或 Q 王 gzkyk 
(g 用 1124/12988X152082 估计 ). 类 似 地 考虑 其 他 各 州 第 站 年 人 口 数 yx， 

(2) 设 z 为 加 州 第 & 年 人 口 比例 ,ziri 二 azi ,a 直接 用 15206/178246- 二 12988/165070 
估计 . 

7. (1) 商品 数量 和 价格 不 稳定 . (2) 当 a,b 为 正 数 时 ,特征 根 的 模 大 于 1. 

8. 设 zi ,yi 分 别 为 田鼠 和 猫 涉 磨 第 & 年 数量 , 则 ze 二 (1 十 ni 一 Qi) Xi Yeti 二 
一 rz 十 azxe) yr 平衡 点 (150,200) 不 稳定 . 

9. 设 zi ,yi 分 别 为 草 和 鹿 第 年 数量 , 则 xiti 二 ZX 十 r(1 一 ZA/N)zxe 一 aysza/N， 
yt! 二 (1 一 d 十 bz/N)y4. 平 衡 点 (1800,600) 稳 定 . 

10, 用 三 点 公式 做 数值 微分 . 


实验 3 


2. 总 体 比 较 选 4,9,16 三 点 . 

3. 梯形 公式 结果 为 1. 37298000000000; 辛 普 森 公式 结果 为 1. 37426666666667; 精 确 
值 为 1. 37486642915263. 

5. 提示， 计算 单位 贺 的 面积 , | edz,|， 

6. 平均 值 为 0.0285， 

8. N=3 即 可 ,结果 为 0. 1097. 

9. 取 0.01, 结 果 为 1. 4081, 精 度 满足 要 求 . 

10. 面积 为 11. 34. 

11. 42415. 632km* (分 段 线 性 插值 ,辛普森 积分 公式 ) ;42468. 331km? (三 次 样 条 插值 ， 
辛普森 积分 公式 ). 

12. 12671( 三 次 样 条 插值 );12992( 分 段 线 性 插值 ). 


1 po 
I 二 训 入 等 ， 


实验 4 


2. 引擎 关闭 瞬间 (前 ) 火 箭 的 高 度 为 12. 2km, 速度 为 267. 2m/s, 加 速度 为 0. 91m/s ; 火 
箭 到 达 最 高 点 时 的 高 度 为 13. 1km, 加 速度 为 一 9. 8m/s?， 

3.， (1) 约 274s,2min 时 的 高 度 为 0. 9434m. 

4. (1) 圆 桶 只 受 重 力 G、 浮 力 下 及 阻力 f 的 作用 , 设 其 下 降 速 度 为 wv, 阻力 与 下 沉 速 


度 比 系数 为 5,m 为 郴 质 量 , 则 凶 一 /一 人 了 如 ,其 中 ,G 一 mg,g 为 重力 加 
速度 

《2) 解析 求解 : * 一 于 (G 一 F 一 ero) ,其 中 < 由 初始 条 件 确定 .工程 师 们 赢得 了 这 
场 官司 . 


dy] [| -二 2 
dz Vy 十 并 

5. (1) 一 5 
dz Vx 


粳 】 l® Tz 
《2) 第 67s 小 船 到 达 B 点 . 
(3) 当 vw 二 0m/s 时 ,小 船用 50s 到 达 B 点 ; 当 w= 二 0. 5m/s 时 ,小 船用 53. 5s 到 达 B 
点 ; 当 了 三 1. 5m/s 时 ,小 船用 114. 5s 到 达 B 点 ; 当 wv 二 2m/s 时 ,小 船 不 能 到 达 B 点 . 
8. (1) 当 t 充 分 大 时 ,zx 与 y 数量 悬殊 变 大 ,最 终 竞 争 的 结果 是 一 方 灭绝 ,一 方 繁荣 ， 
(3) 说 明 当 51 ,s; 均 处 于 同一 水 平 段 时 (小 于 1) ,两 物种 竞争 激烈 程度 加 剧 ,没有 一 方 
有 绝对 的 优势 ;s,s 都 大 于 1 时 ,竞争 中 有 一 方 具有 绝对 优势 . 


实验 5 


1. (1) z=(1,1,. ,1)T. 

(2) 随 n 和 的 载 大 , 希 尔 伯 特 矩阵 逐渐 显 出 明显 的 病态 性 质 ,而 对 范 德 蒙 矩 阵 ， 

4 和 8 的 微小 扰动 对 解 的 影响 相对 较 小 . 

(3) 计算 得 到 的 误差 明显 小 于 用 条 件数 估计 的 误差 . 

2. 《1) 两 种 方法 都 不 收敛 . 

(2) 都 收敛 于 (一 0.0984， 一 1,.1639，0. 5574). 

(3) 雅 可 比 近 代 法 不 收敛 ,高 斯 - 赛 德尔 迭代 法 收 伍 于 (一 0. 3658， 一 0. 5132， 
0. 9421). | 

3. 《1) 高 斯 - 赛 德 尔 迄 代 向 量 收敛 的 速度 快 于 雅 可 比 近 代 . 

(2) 收敛 性 与 初始 向 量 和 4 无关, 都 收敛 .对 角 线 的 数 越 大 ,收敛 越 快 . 
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4. X 一 (61.5030，64. 0030，67. 0782，… , 521.6898, 546.5862, 572.6707). 

5, (Ti, 1s, <***, To) = (2.0005, 1.3344, 0.8907, 0.5955, 0.3995, 0.2702,0.1858, 
0. 1324，0. 1011, 0.0867), 1,=5. 9970. 

6. 各 反应 器 的 浓度 : (11. 5094，11. 5094, 19.0566, 16. 9983, 11. 5094). 


‘ Fisin 工 十 Fssin 工 一 100， 
6 3 
工 _ 工 一 
Ficos 6 Fscos 3 05 


一 下 Sin V0 
一 Ficos -Ft+H, 一 0， 
一 Fssin 0 


F;, 二 Fscos 0 


(Fi,F;,F,,H,,Vi,Vi)=(50.0000,—43.3013, 86.6025,0,25. 0000,75. 0000) ， 
其 中 ,FF 与 互 : 反方 向 . 

8. (2) (8481.0, 2892.4, 1335.4, 601.3, 140.5). 

(3) (10981.0, 3892.4, 1835. 4,601.3,—259. 5). 

9. w= 二 1.25 时 ,SOR 和 迭代 法 收敛 的 最 快 . 


实验 6 


1. 有 两 个 解 ,分 别 位 于 0 和 1. 4044 附近 . 

2 提示 :一 个 三 阶 矩 阵 可 以 用 9 个 决策 变量 确定 . 其 实 ,MATLAB 中 可 以 直接 将 矩 
阵 作为 决策 变量 求解 . 

3, (1) 月 利率 为 0. 22%%， 

(2) 第 一 方案 年 利率 xz 二 0. 0731, 第 二 方案 年 利率 x 二 0. 0639, 故 第 二 种 方式 较 
优惠 . 

4. V=10 时 ,zx 一 1.7166;V 一 50 时 ,z 一 1. 1447;V 一 100 时 ,x 二 0. 5955. 

5, a 二 0. 4329( 即 24. 80")， 

6. 可 能 的 情况 : 

(1) 0.0% 58.6% 41.4% 0.00% 71.951°; 

(2) 0.0% 78.0% * 0.00% 22.0% 76. 946°. 
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7. 分 又 点 : 7.3890,12.5117,14. 2442,14. 6528; 符合 Feigenbaum 常数 规律 . 
8. 考虑 期 望 价格 非 负 分 叉 点 ; 1. 0769, 0. 9065, 0. 8968, 0. 8685; 非 负 部 分 符合 
Feigenbaum 常数 规律 . 


实验 7 


1. (1) (3,2);(3.5844,—1.8481). 
(2) (0.2858,0.2794); (一 21.0267， 一 36.7601). 
(3) (0,0,0,0). 
(4) (1,0,0). 
2. (1) x 二 0 或 Xx, 二 0 或 z= 二 1， 
(2) (0,0). 
(3) (1,.7954,1. 3779). 
(4) (2. 6071,3.8143);(3. 9060,3. 9875). 
. 3. 提示 :一 个 电阻 R 消耗 的 功率 为 1?R, 其 中 了 为 电阻 RR 上 的 电流 . 
4. (3.5833,1. 8417). 
5. 提示 : 设 第 一 个 点 为 (0,0) ,然后 设 对 应 的 点 为 xi,y;, 求 
Dr zi) + (ym—y) — dy 
达到 最 小 的 解 即 可 . 
6. x= (3., 6984e— 00] ，1. 4909e 十 000， 一 1. 0165e 十 000，1. 1693e 一 002， 
2. 4890e 一 002)， 
7.a 一 0.9902，u 一 0.7824 ,p=0.6391. 
8. 6=46.8, k=3.62, k=0.28. 


实验 8 


1. (1) 基 解 是 (0,0.4,1.8),(0.5,0,1.5) 和 (3, 一 2,0); 基 本 可 行 解 是 (0,0. 4,1. 8)， 
(0. 5,0,1.5) ;最 大 值 是 3. 5, 相 应 的 最 大 点 是 (0.5,0,1. 5); 两 个 约 东 为 有 效 约 束 ; 最 小 值 
是 2.2, 相 应 的 最 小 点 是 (0,0.4,1.8); 两 个 约束 为 有 效 约束 . 

(2) 基 解 为 : (一 1.5000,4. 2500 ,一 3.7500),( 一 0. 4286,1. 5714,0),(1,3,0),(6， 
—7,0),(0.2,0,2.2),(7,0,9),(1. 3333,0,~—2,3333),(—2,0,0),(0,0,—5),(0.75,0, 
0) ,C2.5,0,0),(0,0.5,1.5),C0,3.5,—1.5),(0,2,—3),(0,2,0),(0,5,0),(0,1,0),(0, 
0,2), (0,0,3),(0,0,0). . ; 
基本 可 行 解 为 ;(1,3,0), (0.2,0,2.2),(7,0,9), (0,0.5,1.5),(0,2,0),(0,5,0), 
(0,0,3). . | 


OE 
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最 大 点 和 最 大 值 为 (0,5,0) ,10. 

最 小 点 和 最 小 值 为 (7,0,9) ,一 

2. 7 一 2 时 最 小 值 为 一 0.5;2 一 10 人 最 小 值 为 一 1. 00; 2 一 50 时 ,最 小 值 为 一 1. 00, 
3, (1) 最 优 值 为 一 394. 7506 ; 

(2) 最 优 值 为 一 4150. 4101. 

4. (1) 至 少 有 4 个 局 部 极 小 点 ,全 局 极 小 点 为 x 二 6. 3257,z 一 一 443. 6717. 

(2) 至 少 有 3 个 局 部 极 小 点 ,全 局 极 小 点 为 x 一 (2.0000,0. 1058) ,= 一 一 2.0218. 
(3) 可 行 域 由 两 个 不 连通 的 区 域 组 成 (因此 每 个 区 域 至 少 有 1 个 局 部 极 小 点 ), 全 局 


极 小 点 为 x 二 (2.3295,3.1785),z 二 一 5. 5080. 


(4) 至 少 有 5 个 局 部 极 小 点 ,全 局 极 小 点 为 x 二 (1. 1166,1. 2204,1.5378,1.9728， 


1.7911),z 一 0. 0293. 


元 


). 


(5) 至 少 有 18 个 局 部 极 小 点 ,全 局 极 小 点 为 x 二 (5,1,5,0,5,10) ,z= 二 一 310. 
5. 初 值 为 (一 3, 一 1, 一 3, 一 1) 时 ， 

(1) x = (—10., 0000, —10. 0000,1. 0123 ,1.0248) ,太一 一 1. 2087e 十 006. 
(2) x 一 (一 9. 5474,1. 0474,0. 9998,0. 9997) ，j = 一 8. 1179e 十 005. 

(3) x = (—3.1623,3.1623 ， 一 1.1677,1. 3703) ，j 一 一 4. 6062e 十 003. 

初 值 为 (3,1,3,1) 时 ， 

(1) x = (10.0000, —10.0000,0.9967,0.9933), f=—1.2087e 十 006. 

(2) x = (10.0000, —1. 0000,1.0000,1.0001), f=—1. 0200e 十 006. 

(3) x = (3.1623, —3.1623, —1.1677,1. 3703), f=~—1.7140e 二 004. 

6. 原 有 能 力 配水 : 

A 水 库 为 乙 区 送水 50kt; 

B 水 库 为 乙 区 送水 50kt ,为 丁 区 送水 10kt; 

C 水库 为 甲 区 送水 40kt, 为 丙 区 送水 10kt. 

获 利 47600 元 . 

增加 能 力 后 配水 : 

A 水库 为 乙 区 送水 100kt; 

B 水 库 为 甲 区 送水 30kt, 为 乙 区 送水 40kt, 为 丁 区 送水 50kt; 

C 水 库 为 甲 区 送水 50kt, 为 两 区 送水 30kt. 

获 利 88700 元 . 

7. (1) 用 于 购买 A,B,C,D,E 的 资金 分 别 为 218. 1818,0,736. 3636,0,45. 4545( 万 
利润 为 29. 8364 万 元 . 

(2) 用 于 购买 A,B,C,D,E 的 资金 分 别 为 240,0,810,0,50( 万 元 ). 借 资金 100 万 元 ， 


利润 为 30. 0700 万 元 . 


(3) 若 证 券 A 的 税 前 收益 增加 为 4.5% ,投资 不 改变 ,利润 为 30. 2727 万 元 . 若 证 券 C 
的 税 前 收益 减少 为 4.8% ,购买 A,B,C,D,E 的 资金 分 别 为 336,0,0,648,16( 万 元 ) ,利润 
为 29. 4240 万 元 ,投资 变化 . 

8. (1) 最 小 总 费用 为 500 万 元 . 

(2) 最 小 总 费用 为 189 万 元 . 

9. 每 周 普 通 品牌 生产 5454. 54kg ,豪华 品牌 生产 0kg, 蓝 带 品 牌 生产 6666. 66kg; 每 周 
购 入 奉 仁 2000kg, 核 桃仁 4000kg ,腰果 仁 3121. 21kg, 胡 桃仁 3000kg. 设 普通 品牌 中 使 用 
杏仁 0kg, 核 桃仁 1363. 63kg, 腰果 仁 1090. 90kg, 胡桃 仁 3000kg; 蓝 带 品牌 中 使 用 查 仁 
2000kg, 核 桃仁 2636. 36kg ,腰果 仁 2030. 30kg, 胡 桃仁 4132. 96kg. 

10. (1) 最 大 利润 为 40 万 元 ; 

(2) 最 大 利润 为 60 万 元 ; . 

(3) 最 大 利润 为 75 万 元 (针对 产品 A 的 最 大 市 场 需 求 量 增长 为 600t 的 情况 ). 

11. 按 10, 49,69,12Q,39 的 顺序 流 过 的 电流 是 ， 

371. 3846 ,338. 6154,163. 8462,207. 5385 ,502. 4615， 

总 功率 :1, 0160e 十 006. 

12. (1) Ri ,Rs ,Rs ,R, 分 别 为 0.5,0.3333,0.25,0.1111 时 ,总 功率 最 小 ,为 72; 

(2) Ri ,Ri ,Rs ,Rs 分 别 为 3.000,3. 000,3.000,0. 667 时 ,有 最 小 总 功率 60;. 

13， 两 个 均 是 高 为 2m 的 正方 形 围墙 , 边 长 分 别 为 343. 38m 和 31. 62m. 

三 角形 时 :两 个 均 是 高 为 2m 的 正三 角形 围墙 , 边 长 分 别 为 48. 6m 和 451. 94m. 


1. (1) 解 为 (5, 4) ,目标 值 为 71. 

(2) 解 为 (4，2) ,目标 值 为 340. 

2. (1) 解 为 (2,2,3,3) ,目标 值 为 一 1. 

(2) 解 为 (10,0,0,0), 目 标 值 为 50. 

3. 解 为 (1,1,1, 一 1) ,目标 值 为 20. 

4. 最 大 利润 为 1620 元 ,此 时 选择 了 40 个 订单 2,460 个 订单 5, 其 余 订单 均 不 选择 . 


5. 所 用 时 间 最 短 为 70( 单 位 ). 第 1 人 完成 第 2 项 工作 ,第 2 人 完成 第 1 项 工作 ,第 3. 


人 完成 第 3 项 工作 ,第 4 人 完成 第 4 项 工作 . 

6. 10 城市 : 

工人 2 指派 给 城市 1, 工人 7 指派 给 城市 2, 工 人 4 指 派 给 城市 3, 工人 9 指派 给 城市 
4, 工 人 8 指派 给 城市 5, 工人 5 指派 给 城市 6, 工 人 6 指派 给 城市 7, 工 人 3 指派 给 城市 8， 
工人 1 指派 给 城市 9, 工人 10 指派 给 城市 10 时 ,可 取得 最 小 费用 : 每 月 1142. 00 元 . 

5 城市 : 


0 
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第 1 人 被 派 往 城市 4, 第 2 人 被 派 往 城市 1, 第 3 人 被 派 往 城 市 3, 第 4 人 
5, 第 5 人 被 派 往 城市 2. 最 小 通话 费用 为 341 元 . 

7. 选 定 大 学 生 量 为 29 和 21 的 城市 ,向 相 邻 的 大 学 生 量 为 56 和 71 的 城市 供 贷 , 目 
标 值 为 177. 

8. 《1) 可 雇佣 半 时 服务 员 3 个 . 

雇佣 7? 个 全 时 服务 员 , 其 中 2 个 在 12:00~13:00 用 午餐 ,5 个 在 13;00 一 14;00 用 午 
餐 . 雇佣 半 时 服务 员 3 个 ,分 别 在 10:00 时 ,11:00 时 ,下 午 1:00 时 开始 上 班 .每 天 所 付费 
用 最 少 为 820 元 . 

(2) 不 能 雇佣 半 时 服务 员 . 

至 少 11 名 全 员 雇 员 ,费用 至 少 1100 元 . 

(3) 雇佣 半 时 服务 员 无 限制 

共 雇 佣 半 时 服务 员 14 个 ,9:00 时 开始 工作 的 4 个 ,12:00 时 开始 工作 的 2 个 ,1:00 
时 开始 工作 的 3 个 ,2:00 时 开始 工作 的 5 个 .一 共 花 费 560 元 . 

9. 购买 A 原油 1000t, 全 部 用 于 生产 乙 种 汽油 ,可 获得 最 大 利润 500 万 元 . 

10. 应 该 新 购 开 型 拉丝 机 和 联合 机 ,而 不 改造 原 有 塑 包机 . 具体 计划 :用 原 有 工 型 拉 
丝 机 生产 规格 1 时 间 为 3061. 2h; 用 原 有 工 型 拉丝 机 生产 规格 2. 时 间 为 2551h; 用 联合 机 
生产 规格 1 时 间 为 6443h, 生 产 规格 2 时 间 为 6872h, 不 用 任何 塑 包机 . 总 费用 57. 4 万 元 . 

11. 只 使 用 3 种 切割 模式 (分 别 使 用 9,7,3 次 ); 每 根 原料 钢管 用 第 1 种 模式 生产 4 
种 产品 各 1,2,0,2 根 , 用 第 2 种 模式 生产 4 种 产品 各 0,1,3,1 根 , 用 第 3 种 模式 生产 4 种 
产品 各 2,1,0,2 根 ;目标 函数 值 为 19. 6. 

12. 第 2 种 模型 冲压 次 数 为 4.0125 万 次 ,第 3 种 模型 冲压 次 数 为 0:375 万 次 ,第 4 种 
模型 冲压 次 数 为 2. 000 万 次 .净利 润 4298 元 . 


实验 10 


1. (1) 0. 9916; (2) 0. 8904; (3) 97., 

2. 14.7350( 均 值 ),0. 3329( 标 准 差 ),0. 1108( 方 差 ),1. 2000( 极 差 ). 

3. 均值 .标准 差 、 极 差 、 偏 度 . 峰 度 分 别 为 ; 80. 1000,9.7106,44, 一 0. 4682 ,3. 1529. 
4. 由 于 有 随机 波动 ,小数点 后 取 两 位 数字 ; 

(1) 0.69; (2) 一 29.74; (3) 2.96; (4) 0. 95. 

5. 近似 0. 7. 

6， 体积 约 为 3. 14. 

7. 报 童 每 天 购 进 1968 份 报纸 可 获得 最 大 利润 . 

8. 提示 :假设 c 为 每 个 灯泡 的 回收 费用 , 则 目标 函数 为 


部 分 实验 练习 的 参考 答案 


cm 
Ka 十 Ko| ri eS Ke| p Ci) d(x) 
a , 


F(T) = 


9.(1) m=2. 33m; (2) m=2. 35m., 


实验 11 
+ 


2. (2) 假设 检验 a=0. 05. | 

1 月 份 汽油 的 价格 可 以 说 是 115 美 分 /gal, 置信 区 间 是 [113. 3388 ,116. 9612]; 

2 月 份 的 汽油 价格 不 是 115 美 分 /gal, 置信 区 间 是 [119. 0129 ,122. 4871]. 

(3) 提示 : 如 果 将 1 月 .2 月 对 应 数据 看 成 同一 个 加 油 的 数据 , 则 价格 差 为 5. 6 美 分 ， 
置信 区 间 为 L3. 0393 ,8. 1607]; 如 果 认 为 1 月 ,2 月 的 数据 完全 随机 ,不 能 简单 采用 1 月 、2 
月 对 应 数据 的 差 作 为 新 的 数据 . 用 两 总 体 的 :分布 检 验 . 

3. (2) 服从 正 态 分 布 . 

4， 假设 检验 a 二 0. 05. 

检验 pi 二 js ,均值 不 相等 ; 

检验 yi 三 yz, 接受 假设 ; 

检验 pi 宇 ps ,拒绝 假设 . 

5. 乙方 应 该 接受 .为 了 不 接受 这 批 产品 ,可 以 通过 将 置信 和 概率 修改 为 0.8271 以 下 ， 
或 将 合格 率 升 高 至 92. 23% 或 以 上 ,或 将 抽检 数 提高 到 155 件 或 以 上 . 

6. (1) 符合 正 态 分 布 ， 


(2) : 
项 目 身高 /cm 体重 /kg 
均值 点 估计 170. 2500 61. 2700 
SEA 
均值 区 间 估 计 [169. 1728,171. 3272] [59. 8954,62. 6446] 
标准 差 估计 5. 4018 6. 8929 
多 
标准 差 区 间 估 计 [4. 7428 ,6.2751] [6. 0520 ,8. 0073] 


(3) 身高 有 较 明 显 的 变化 ,体重 没有 明显 变化 . 

7. 从 全 部 数据 来 看 , 胃 溃 疡 病人 和 正常 人 的 溶菌 酶 含量 有 显著 差别 , 若 去 掉 错 误 数 
据 后 ,二 者 无 显著 差别 ， 

8. 两 次 测验 难度 不 相同 . 

提示 : 本 题 两 组 数据 不 能 视 为 两 个 独立 的 样本 . 
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9. 不 相同 . | 
10. 提示 :因为 中 国 的 样本 容量 非常 大 (20 万 ) ,平均 分 配 到 每 个 年 龄 组 也 有 1 万 以 
上 ,日 本 的 数据 没有 具体 给 出 样本 量 . 所 以 ,本 题 的 关键 是 样本 容量 的 设 定 .样本 的 容量 越 


大 ,数据 的 均值 和 方差 越 接近 真实 母体 的 均值 和 方差 . 当 每 一 组 数据 设 定 样本 容量 为 
5000 时 ,用 两 个 母体 的 上 检验 的 结果 为 (显著 水 平 0.05) : 


不 同 的 容量 会 得 到 不 同 的 结果 . 
实验 12 


1, 模型 为 zx 二 29. 5455 一 0. 3291t(z 为 刀具 厚度 ,t 为 时 间 ), 检 验 通 过 . x(7. 5) 王 
27.0773, 两 种 办 法 计算 的 预测 区 间 分 别 为 [25. 9974，28. 1571] 和 [26. 2039，27. 9506]; 
zx(15) 二 24. 6091, 预测 区 间 分 别 为 [23. 1836，26. 0346] 和 [23.7358 ，25. 4824]. 

2. 模型 为 y= 二 83. 2116 十 1. 2985zi 十 2.3372zz(y 为 收入 ,zi 为 电视 广告 费 ， zi 为 报 
纸 广 告 费 ) ,检验 通过 . 有 一 个 异常 点 ,去 掉 后 y 一 81.4881 十 1. 2877zi: 十 2. 9766xs ,检验 效 
果 更 好 . 

3. (1) 记 > 为 身高 ，z 为 年 龄 ,高 蛋白 食物 组 y 一 50. 5224 十 15. 8976z， 低 蛋白 食物 
组 y 一 50.7934 十 9. 1884x. 

(2) 根据 计算 结果 (15. 897 和 9.1884), 利 用 名 的 性 质 检验 ,有 显著 影响 . 

4. 记 y 为 睡眠 时 间 ， x 为 年 龄 ，y 一 646. 6229 一 14. 0416z， 检 验 通过 . y (10)= 
506. 2071, 预测 区 间 为 [480. 4448，531. 9695]. . 

5， 模型 是 y= 一 34. 0725 十 1. 2239zi 十 4. 3989zs; 两 个 异常 点 去 掉 后 为 y= 
一 35.7095 十 1.6023x; 十 3. 3926z. 

6. (1) 记 y 为 磨损 量 ,z 为 转速 ,两 种 办 法 得 到 的 模型 均 为 y 一 一 6.7500 十 0. 2779z， 
但 是 用 原始 数据 的 模型 系数 的 置信 区 间 小 得 多 . 

(2) 二 次 函数 模型 为 y 二 63. 2143 一 0.7060z 十 0.0033z? ,情况 与 (1) 相 同 . 

7. (1) y=83.4438—5. 6682z;. 

(2) y= 90. 8529 一 0. 1870z1—5.4671zx;. 

(3) y=118.0135—0. 3254z 一 4. 5694xs 一 0. 1561zs. 

(4) 有 两 个 异常 点 . 
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8. (1) y=90.1814~—27.6588zi—~—3.2283x2 ,y 一 24. 5471 一 4. 6285zi 一 1. 4360z?， 

(2) 普通 型 : zx 一 0; 豪 华 型 : zs 一 1,y 一 64. 5753 一 16. 1436xi 一 2. 3322z， 一 
14. 42227zs， . 

(3) 两 种 类 型 残 差 散 点 图 的 趋势 不 同 , 表 明 zi ,zs 与 xs 有 交互 作用 . 

(4) 模型 为 y= 二 84. 9940 一 19. 0370zi 一 6. 8094zxs 一 65. 6343xs 十 0. 2706x; 十 
23.0304zix3s 十 1.7923zz7zs。 

9. (1) 模型 为 > 一 一 12.7400 十 26. 3000xi 十 3. 0867zs ,中 等 搅拌 程度 的 残 差 与 其 他 
的 不 同 . | 

(2) 搅拌 程度 表示 为 : 弱 一 一 (zzo) 王 (0,0)， 中 一 一 (zz) 一 (0,1)， 强 一 一 
(zyz) 一 (1,0)， 洗 衣 粉 用 量 为 r; ,模型 为 y= 二 10. 6867 十 52. 6000zi 十 34. 9200z? 十 
3. 0867zs. 

(3) 有 一 点 改进 . 

10. 模型 为 

y 一 一 62. 3489 十 0.8396zi 十 0.0371z? 十 5.6846zz， 

或 | | 1 
y 一 一 65.3856 十 1.0172zxi; 十 0.0358z 十 5.2171zs 十 0.1662zx? 一 0.0196zizz. 
11. 记 y， Zz1，ZXz，Zs 依 次 为 病痛 减轻 的 时 间 、 用 药 的 剂量 、 性 别 和 血压 组 别 ,模型 为 
yy 一 43.3742 一 6.9834zi 十 43.6765zxi 十 0.5111x? 十 0.9551zixz 一 7.5294zz. 
12. Bi 一 160. 2802,p 二 0.0477,X 二 52.4035,X 一 0.0164,7; 的 置信 区 间 仿 零点, 令 
加 一 0 后 得 Bl 二 166. 6025,pB, 一 0.0580,7 一 4200252. | 汪汪 

13. (1) a 一 7. 9781,，& 一 0. 3016. 

(2) L=3260.42, a=30. 5350,，& 一 0. 4148. 

(3) L=4810.076, 6=4.592, k=0. 17478. 
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MATLAB 使 用 人 门 


MATLAB 是 MATrix LABoratory( 和 矩阵 实验 室 ) 的 缩写 ,是 由 美国 MathWorks 公司 
20 世纪 80 年 代 初 开发 的 一 套 以 矩阵 计算 为 基础 的 科学 和 工程 计算 软件 . 它 将 数值 计算 、 
可 视 化 和 编程 功能 集成 在 非常 便于 使 用 的 环境 中 ,并 具有 方便 的 绘图 功能 和 为 解决 各 种 
特殊 的 科学 和 工程 计算 问题 提供 的 许多 工具 箱 (toolbox), 具 有 计算 功能 强 、 编 程 效 率 高 、 
使 用 简便 .易于 扩充 等 特点 ,目前 已 经 发 展 成 为 国际 上 最 优秀 的 高 性 能 科学 和 工程 计算 软 
件 之 一 .本 附录 给 出 MATLAB 简要 的 使 用 说 明 ,要 了 解 更 多 的 内 容 请 使 用 MATLAB 在 
线 帮 助 系统 或 参考 有 关 书 籍 . 

先 大 致 介绍 一 下 MATLAB 的 工作 界面 和 经 常 使 用 的 各 种 窗口 . 假定 在 您 的 计算 机 


工作 区 显示 和 修改 将 窗口 移出 
当前 上 且 录 窗口 获得 帮助 ”命令 窗口 ”当前 目录 名 MATLAB 窗口 ”关闭 窗口 


| 
开始 按钮 命令 历史 窗口 窗口 分 隔 栏 ， 可 调整 窗口 大 小 


图 1 MATLAB 的 初始 界面 


1 矩阵 及 其 运算 


里 已 经 安装 了 MATLAB 6. 5. 1 或 以 上 版 本 的 软件 , 则 在 WINDOWS 系统 下 启动 
MATLAB 软件 将 在 屏幕 上 看 到 如 图 1 所 示 的 MATLAB 的 主 窗口 (桌面 ). 在 该 主 窗口 
中 , 除了 WINDOWS 应 用 程序 一 般 应 该 具有 的 菜单 和 工具 栏 外 ,还 包括 了 右边 的 命令 窗 
口 和 左边 的 工作 区 /当前 目录 窗口 、 命 令 历 史 窗 口 ,以 及 工具 栏 后 边 的 显示 和 修改 当前 目 
录 名 的 小 窗口 等 . 命令 窗口 下 的 提示 符 为 “》”, 表 示 MATLAB 已 经 准备 好 ,可 以 接受 用 户 
在 此 输入 行 命令 ,命令 和 程序 执行 的 结果 也 显示 在 这 个 窗口 ;过 去 执行 过 的 命令 名 则 依次 
显示 在 命令 历史 窗口 中 ,可 以 备查 .工作 区 窗口 内 用 于 显示 当前 内 存 中 变量 的 信息 (包括 
变量 名 、 维 数 . 具 体 取 值 等 ), 初 始 时 这 部 分 信息 为 空 ; 当 在 该 窗口 中 选择 “当前 目录 ?” 
(Current Directory) 选 项 卡 时 ,该 窗口 可 以 切换 成 当前 目录 窗口 ,显示 当前 目录 下 的 文件 
言 息 . 此 外 ,在 MATLAB 中 经 常会 使 用 到 的 还 有 另外 两 个 窗口 :一 个 是 显示 和 编辑 
MATLAB 源 程序 文件 的 编辑 窗口 , 另 一 个 是 打开 在 线 帮 助 系统 时 的 帮助 文件 显示 窗口 . 


1 和 矩阵 及 其 运算 


MATLAB 的 主要 数据 对 象 是 矩阵 ,标量 , 行 向 量 ( 数 组 )、 列 向 量 都 是 它 的 特例 ,最 基 
本 的 功能 是 进行 矩阵 运算 ,但 MATLAB 对 于 矩阵 有 一 些 特殊 规定 的 操作 、 运 算 方 式 . 
1.1 和 矩阵 的 直接 输入 

和 矩阵 输入 有 多 种 办 法 ,如 直接 输入 每 个 元 素 ;由 语句 或 函数 生成 ;在 M 文件 (以 后 介 
绍 ) 中 生成 等 . . 

MATLAB 中 直接 输入 矩阵 时 不 用 描述 矩阵 的 类 型 和 维 数 ,它们 由 输入 的 格式 和 内 
容 决 定 , 小 规模 的 矩阵 可 以 用 排列 各 个 元 素 的 方法 输入 ,元 素 放 在 方 括号 中 ,同一 行 元 素 
用 逗号 或 空格 分 开 , 不 同行 的 元 素 用 分 号 或 回 车 分 开 . 如 在 命令 窗口 中 键入 

3》A=[1,2,3;4,5,6] 口 (表示 在 命令 窗口 中 的 提示 符 下 键入 , 口 表示 回 车 ,下 同 ) 


或 
》A=[123;456] 口 
或 
)A=[1 2 3 口 


4 5 6] 口 
都 输入 了 一 个 2X3 和 矩阵 和 ,屏幕 上 显示 的 输出 为 
A 二 
1 2 3 
4 5 6 
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和 矩阵 中 的 元 素 可 以 用 它 的 行 、 列 数 ( 放 在 圆 括号 中 ) 进 行 访问 ,例如 (以 下 在 回 车 符 口 
后 直接 给 出 屏幕 上 显示 的 输出 ) 
ya=A(2,1) 口 (MATLAB 区 分 大 小 写字 母 ,a 和 A 是 不 同 的 变量 ) 


a 三 
4 


或 者 不 指定 输出 变量 ,MATLAB 将 回应 ans(answer 的 缩写 ), 如 


》A(2,3) 口 
ans= 
6 


和 矩阵 中 的 元 素 也 可 以 仅 用 一 个 下 标 来 访问 ,此 时 元 素 是 按 列 优先 排序 的 ,例如 


b= AC3) 
b= 

2 
》A(4) 口 
ans= 

5 


4 输入 后 一 直 保 存在 内 存 工作 区 (工作 空间 ,Workspace) 中 ,也 会 显示 在 工作 区 窗口 
内 (包括 变量 名 、 维 数 、 具 体 取 值 等 ). 工作 区 内 的 变量 可 随时 直接 调用 ,除非 被 清除 或 
替代 ， 
可 以 直接 修改 矩阵 的 元 素 , 如 
》A(2, 1) 三 7 口 
下 三 
1 2 3 
7 5 6 
》A(3,4) 三 1 口 
A= 


OJ 一 
Om 
Om 
一 OO 


原来 的 A 没有 3 行 4 列 ,MATLAB 自动 增加 行列 数 ,对 未 输入 的 元 素 赋值 0 
1.2 矩阵 的 函数 生成 


MATLAB 提供 了 一 些 函 数 来 构造 特殊 和 抢 阵 ,如 
yw 三 zeros(2;3) 口 〈(2x3 和 零 矩 阵 ) 
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六 三 
0 0 0 
0 0 0 

为 =ones(3) 口 (3x3 全 1 和 矩阵, 方 阵 只 需 输 入 行 数 ,这 几 个 矩阵 生成 函数 均 如 此 ) 


UU 三 


》v=eye(3,4) 口 〈 对 角 线 为 1 的 3x4 和 矩阵 ) 


V 一 


0 
1 
0 


OO 


》x=rand(1,3) 口 (1x3 的 (0,1) 均 匀 分 布 随机 矩阵) 
X 一 
0.2311 0.8913 0.0185 
矩阵 生成 函数 还 有 mXn 的 标准 正 态 分 布 矩 阵 生成 函数 randnCm,n) ;nt 阶 Hilbert 和 矩 
阵 hitb(Cn) ;2 阶 幻 方 矩阵 magic(Cn) ;n 阶 pascal 矩阵 pascal(n) 等 ,请 读者 不 妨 试 试 . 


1.3 ”和 矩阵 的 裁剪 与 拼接 


从 一 个 矩阵 中 取出 若干 行 ( 列 ) 构 成 新 矩阵 称 为 裁剪 ,MATLAB 中 “: ”是 非常 重要 
的 裁剪 工具 ,如 
》A(3,: ) 口 〈A 的 第 3 行 ) 
ans 三 
0001 
》A(: ,2) 口 (A 的 第 2 列 ) 
ans 一 


2 
5 
0 
3B=A(G1:2,:) 口 (A 的 第 1~2 行 ) 
B= 
1 2 3 0 
7 5 6 0 


C=BC: ,2 :4) 口 (B 的 第 2~4 列 ) 
C= 
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)D=A(2 : end,[2,4]) 口 〈A 的 第 2 行 至 最 后 行 , 第 2,4 列 ; end 表 示 最 后 可 能 的 下 标 值 ) 


D= (等 价 于 A(2 : 3,[2,4]) 或 A(L2,3],[2,4])) 
5 0 
0 1 

》D(: ,1)=[] 口 (删除 DD 的 第 1 列 , 口 为 空 集 符号 ) 

口 三 
0 


1 


将 几 个 矩阵 接 在 一 起 称 为 拼接 ,左右 拼接 时 行 数 要 相同 ,上 下 拼接 时 列 数 要 相同 ,如 


》E=[c,ones(2,3)] 口 
于 一 

2 .3220 

5 6 0 1 11 
汗 二 [A(1 : 2, : )jeye(1,4) 口 


F= 
1 2 .30 
7 5 6 0 
1 0 0 0 
)G= [C,zeros(2);9,F(2, : ) 口 
23000 
5 6 0 .00 
9 7 5 6 0 
》H=C(: ) 口 (C 按 列 拼接 成 一 列 向 量 ) 
有 三 
总 
5 
3 
6 
0 
0 


1.4 和 矩 阵 的 基本 运算 
MATLAB 中 提供 了 下 列 矩 阵 运算 符 : 
十 加 法 ; 一 减法 ; " 转 置 ; * 乘 法; " 乘 宕 ;)\ 左 除 ; / 右 除 . 


它们 要 符合 矩阵 运算 的 规律 ,如 果 和 矩阵 的 行列 数 不 符 合 运 算 符 的 要 求 ,将 产生 错误 信 


息 , 这 里 只 将 左 除 和 右 除 的 用 法 叙述 如 下 : 


a 


1 上 矩阵 及 其 运算 


设 4 是 可 逆 矩 阵 ,4X= 昌 的 解 是 4 左 除 B, 即 XX 二 4A\B( 当 B 为 列 向 量 时 ,得 到 方程 
组 的 解 );X4 二 B 的 解 是 4 右 除 B, 即 X=B/4. 
还 应 注意 标量 与 矩阵 进行 上 述 运 算 的 含义 ,请 看 
3XE=E+3 口 《E 的 每 个 元 素 加 3, 即 标量 3 相当 于 元 素 全 为 3 的 与 E 同 维 数 的 矩阵 ) 
E 一 
56344 4 
89344 4 
》cc=Cc(: ,1 :2)x*(1+) 口 (C 的 1,2 列 的 每 个 元 素 乘 以 复数 (1 二 ))) 
CC = 
.2.0000 + 2.0000i 3.0000 + 3.0000i 
5.0000 + 5.0000i; 6.0000 + 6.0000i 
3》C1=CO'  〈 对 复数 矩阵 ,矩阵 的 转 置 是 共 恩 转 置 ) 
Cl1 = 
2.0000 
3.0000 


1.5 矩阵 的 特殊 运算 
MATLAB 为 矩阵 提供 了 下 面 的 特殊 “点 "运算: 
“点 " 转 置 § !. * “点 "乘法 ;，.”“ 点 " 乘 徊 ; .\ “点 ” 左 除 ; ./ “点 " 右 除 . 
“点 ” 转 置 是 复数 矩阵 的 非 共 堪 转 置 . 如 


C2= CC. 口 (和 矩阵 的 非 共 思 转 置 ,请 与 上 面 C1 的 结果 比较 ) 
C2 = 
2.0000 + 2.0000i 5.0000 + 5.0000i 
3.0000 + 3.0000i 6.0000 + 6.0000i 
后 四 个 “点 ”运算 实际 上 是 对 相同 维 数 的 矩阵 的 对 应 元 素 进 行 相应 的 运算 .如 


3A=[1,0,2;3,4,0] 口 。 (对 A 重新 赋值 ) 


2.0000i 5.0000 — 5.0000i 
3.0000i 6.0000 — 6.0000i 


A= 

和 过 

3 4 0 
》B=E(: ,1;:3) 口 (对 B 重新 赋值 ) 
B= 

5 6 3 

8 9 3 


》A. * B 口 
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5 0 6 
24 36 0 
》B.“A 口 
ans = 
5 1 9 
512 6561 1 
》A.NB 口 (与 B. /A 的 结果 相同 ) 
ans SS 
5.0000 Inf ”1.5000 (nf 表示 正 无 穷 ) 
2.6667 ”2.2500 Inf 
》B.NA 口 (与 A./B 的 结果 相同 ) 
ans 三 
0.2000 0 0.6667 
0.3750 -0.4444 0 


应 注意 上 述 运 算 中 两 个 矩阵 的 维 数 应 该 相同 . 至 于 标量 与 矩阵 进行 上 述 运算 的 含义 ,请 看 


》2.A 口 (标量 2 相当 于 元 素 全 为 2 的 与 A 同 维 数 的 矩阵 ) 
ans 一 
2 1 4 
8 16 1 
》A.“2 口 
ans 三 
1 0 4 
9 16 0 


1.6 行 向 量 的 特殊 输入 方式 


行 向 量 与 一 维 数组 是 一 样 的 数据 对 象 , 除 了 作为 矩阵 的 特例 像 1 Xn 甜 阵 一 样 地 输入 


外 , 常 采用 “: ”和 函数 linspace,logspace 两 种 输入 方式 ,它们 的 用 法 可 以 从 下 面 的 例子 


道 . 


)a=1:5 口 (从 1 到 5 公 善 为 1 可 缺 省 ) 的 等 差 数组 ) 


脸 三 


123 4 5 

》)b=1:2:7 口 (从 1 到 7 公差 为 2 的 等 差 数 组 ,如果 输入 b=1 :2 : 8, 得 到 同样 结果 ) 
b= 

1 3. .57 


c=6 :一 3 :一 6 口 (从 6 到 一 6 公差 为 3 的 等 差 数 组 ) 


C 一 


2 语句 和 函数 以 及 其 他 数据 类 型 


6 3 0 -3 -6 
》b=[0 :2:8,ones(1,3)] 口 。 (等 差 数 组 和 行 向 量 拼接 ) 
b= 
0246 8 111 
》inspace(0,1,9) 口 (从 0 到 1 共 9 个 数值 的 等 差 数组 ) 
ans 三 
0 0.1250 0.2500 0.3750 0.5000 0.6250 0.7500 0.87500 1.0000 


即 
linspace (a,b,n) 

生成 从 a 到 4b 共 n 个 数值 的 等 差 数 组 ,公差 不 必 给 出 .与 它 相 仿 的 是 
logspace(a,b,n) 

生成 从 10“ 到 10* 共 n 个 数值 的 等 比 数组 . 
4 等 分 x(MATLAB 中 x 的 符号 是 pi) 的 数组 可 以 用 这 两 种 方式 输入 : 
x=0 : pi/4 : pi 
XxX 三 

0 0.7854 1.5708 2.3562 3.1416 

»》x= linspace(0 ,pi,5) 吕 0D 

输出 同上 . 
请 特别 注意 ”: ”的 用 法 ,其 实 和 矩阵 的 裁剪 中 用 到 的 ”: ”的 含义 与 此 是 完全 相同 的 . 如 
》G(G1: 2:end,4: 一 1:2) 口 (与 GC(L1 3],L4 3 2]) 等 价 ) 


ans 一 


2 语句 和 函数 以 及 其 他 数据 类 型 


2.1 语句 


MATLAB 语句 的 一 般 形式 为 ， 

变量 一 表达 式 

如 果 你 在 命令 窗口 中 输入 一 个 语句 并 以 回 车 结束 , 则 在 命令 窗口 中 显示 计算 的 结果 ; 
如 果 语 句 以 分 号 “;” 结 束 , MATLAB 只 进行 计算 ,不 显示 计算 的 结果 . 如 果 一 个 表达 式 太 
长 ,可 以 用 续 行 号 “...” 将 其 延续 到 下 一 行 . 正如 上 节 所 述 ,当前 内 存 中 变量 的 信息 显示 在 
工作 区 窗口 (包括 变量 名 、 维 数 、 具 体 取 值 等 ); 一 个 语句 中 可 以 只 有 表达 式 ( 即 “变量 = ”省 
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略 ) ,此 时 名 为 ans 的 变量 自动 建立 . 
此 外 ,一行 中 可 以 写 风 个 语句 ,它们 之 闻 要 用 逗号 或 分 号 分 开 . 如 


》a=[12345];b=[13579];... 口 
c=a. x*b, d=axb'，e=a' xb 
c= 
1 6 15 28 45 
d= 
95 


a DC- 
“D 
a 
LS 
DD 
DN 
> 


MATLAB 的 变量 由 字母 .数字 和 下 划 线 组 成 ,最 多 31 个 字符 ,区 分 大 小 写字 母 ,第 
一 个 字符 必须 是 字母 . 对 于 变量 , MATLAB 不 需要 任何 类 型 的 说 明 或 维 数 语句 . 当 输 入 
一 个 新 变量 名 时 MATLAB 自动 建立 变量 并 为 其 分 配 内 存 空间 . 

MATLAB 有 几 个 特殊 的 常量 : 

pi 圆 局 率 r; eps 最 小 浮 点 数 ; Inf 正 无 穷 大 , 特 指 1/0; 

NaN 非 数 (Not A Number) , 特 指 0/0; i,j 都 是 虚数 单位 . 


请 看 
)a=[0.10],b=[100],c=a./b 吕 
d= 

0 1 0 
b = 

1 0 0 


Warning : Divide by zero. 
【03 = 
0 Inf NaN 


变量 也 可 以 用 于 记录 字符 串 . 字符 串 是 用 单 引号 括 起 来 的 字符 集合 ,可 以 像 向 量 一 样 
进行 拼接 和 裁剪 ,如 


)》s1 = 'Hello';s2='every';s3='body';s=[s1,',',s2,'',s3],ss=s(1 ; 5) 吕 DD 
s= 

Hello,every body 
ss= 

Helio 


2 语句 和 涵 数 以 及 其 他 数据 类 型 


2.2 标量 函数 


MATLAB 提供 了 大 量 的 数学 函数 ,按照 其 用 法 分 为 标量 函数 .向 量 函 数 和 和气 阵 函数 
3 种 类 型 . 

常用 的 标量 函数 列 出 如 下 ,只 作 必 要 的 注释 : 

三 角 函 数 : sin cos tan cot sec csc asin acos atan acot asec acsc 
Sinh cosh tanh asinh acosh atanh 

其 他 基本 函数 : sqrt( 正 的 平方 根 ) pow2 (2 的 指数 ) exp(e 的 指数 ) ”log( 自 然 对 
数 ) ”log10( 常 用 对 数 ) iog2( 以 2 为 底 的 对 数 ) abs( 绝 对 值 或 复数 模 ) ”round( 四 会 五 
人 取 整 ) floor( 向 一 ce 方向 取 整 ) ceil( 向 十 ce 方向 取 整 ) fix( 向 0 方向 取 整 ) sign 
(符号 函数 ) real( 取 实 部 ) imag( 取 虚 部 ) ”angle( 取 辐 角 ) rats( 有 理 有 逼近 ) 

这 些 函 数 本 质 上 是 作用 于 标量 的 , 当 它 们 作用 于 和 矩阵 (或 数组 ) 时 ,是 作用 于 和 矩阵 (或 
数组 ) 的 每 一 个 元 素 . 请 看 下 面 的 例子 : 

》x=(0 :0.2 : 1) x pi; y=sinCx) 口 


y= 
0 0.5878 0.9511 0.9511 0.5878 0.0000 
》a=[ 一 3.5 4.6];... 
b= round(a)，c= floor(a)，d= ceil(a)，e= fx(a)，f=rats(a) 上 口 ] 
b 一 一 
-4 5 
c= 
-4 4 
dd 二 
二 3 £5 
e -三 
-3 4 
f= 
—7/2 23/5 


一 个 计算 函数 值 的 常用 命令 是 feval(F,x),F 是 表示 函数 名 的 字符 串 ( 也 可 以 是 汉 
即 在 淆 数 名 前 加 符号 @; 建 议 当 函数 名 出 现在 其 他 函数 的 自 变量 列表 中 时 , 均 采 
用 函数 句柄 形式 ) :如 
x= (0:0.2:;1)*pi; y= feval(sin,x) 口 ] 或 
x= (0 :0.2 : 1)x*pi; y= tfeva(@sin,x) 口 〈 范 数 句柄 形式 ) 


均 得 到 与 上 面 同样 的 结果 : 


SD 
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y= 

. 0 0.5878 0.9511 0.9511 0.5878 0.0000 

简单 的 函数 可 以 采用 inline 函数 形式 输入 (该 函数 返回 的 是 函数 句柄 ) ,如 

x= (0 :0.2: 1)* pi; y= feval(inline('sin(x) + 2") ,Xx) 口 

y 一 

2.0000 2.5878 2.9511 2.9511 2.5878 2.0000 

此 外 ,还 有 一 些 多 于 一 个 自 变量 的 函数 ,如 基本 的 二 元 函数 : atan2 (四 象限 取 值 的 反 

正切 函数 ) ;rem《〔〈 同 余 函 数 ) 等 . 


2.3 向 量 范 数 


有 些 函 数 只 有 当 它 们 作用 于 ( 行 或 列 ) 向 量 时 才 有 意义 , 称 为 向 量 函 数 , 这 些 函 数 也 可 
以 作用 于 矩阵 ,此 时 它 产 生 一 个 行 向 量 , 行 向 量 的 每 个 元 素 是 函数 作用 于 答 阵 相应 列 向 量 
的 结果 . 常用 的 有 : 

max( 最 大 值 ) ”min( 最 小 值 ) ”sum( 和 )〉 length( 长 度 ) mean( 平 均值 ) 

median( 中 位 数 ) prod( 乘 积 ) sort( 从 小 到 大 排列 ) 

请 看 下 例 : 

)a=f4 3.1 —1.2 0. 6];... 

b=min(a), c= sum(a), d= median(a), e= sort(a) [DD 


b= 
一 1.2000 
全 三 
11.9000 
qd 一 
3.1000 
二 汪 
—1.2000 0 3.1000 4.0000 6.0000 
Y=[1: 3;4: 6;7: 9]; fl= prod(f), f2= prod(G1) 口 
f1 = 
28 80 162 
全 = 


362880 


2.4 矩阵 函数 


MATLAB 有 大 量 的 处 理 矩 阵 的 函数 ,从 其 作用 来 看 可 分 为 两 类 :构造 矩阵 的 函数 ; 
进行 矩阵 计算 的 函数 . 对 于 前 者 ,我 们 已 经 介绍 的 主要 有 


2 语 旬 和 函数 以 及 其 他 数据 类 型 


zeros(0 阵 ) ones(1 阵 ) eye( 单 位 阵 ) rand( 均 匀 随 机 阵 ) randn( 正 态 随 机 阵 ) 
还 有 

diag( 生 成 或 提取 对 角 阵 ) triu( 生 成 或 担 取 上 三 角 阵 ) tril( 生 成 或 提取 下 三 角 阵 ) 
等 ,在 实验 5 中 给 出 介绍 . 

对 于 后 者 ,常见 的 有 

size( 大 小 ) ”det( 行 列 式 ) ”rank( 秩 ) inv( 首 矩阵) ”eig( 特 征 值 )”itrace( 迹 ) 
expm( 和 矩阵 指数 ) ”poly( 特 征 多 项 式 ) 等 . 

norm( 范 数 ) ”cond( 条 件数 ) ”Iu(LU 分 解 ) gr( 正 交 分解 ) ”svd( 奇 异 值 分 解 ) 等 ， 
其 中 一 些 在 实验 5 中 给 出 介绍 . 

MATLAB 有 对 和 矩阵 维 数 重新 整理 的 函数 reshape, 如 

3》a=[123;456;7 89;10 11 12]; b= reshape(a,2,6) 

b= 


即 对 a 按 列 优先 整理 成 2X6 的 矩阵 . 


》sa= size(a), sb= size(b) 口 ] 
Sa 二 

4 3 
sb = 

2 6 
}c=reshape(l1 : 9,3,3) 


c= 


1 4 关 
2 5 
3 6 9 


2.5 ”高 维和 矩阵 


除了 基本 的 二 维 矩 阵 ( 及 其 特例 一 一 向 量 . 标 量 ) 外 ,高 维和 矩阵 是 二 维和 矩阵 的 一 种 自然 
而 然 的 扩展 ,MATLAB 中 也 支持 高 维和 矩阵 . 例如 ,下 面 的 语句 输入 了 一 个 3X3X2 的 三 
维 矩 阵 : 


BAC : ,: ,1)=reshape(1:9:3,3); A(:，: ,2)=reshape( 一 1: 一 11: 一 9,3,3) 口 
A(:,:,1) = : : 
1 4 7 
2 5 
6 9 
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A(C: ，: ,2) = 
-1 -4 -7 
-2 -5 -8 
-3 -6 -9 
)a=A(3,2), b=A(3,2,1)，c=A(3,2,2)，d=A(4)，e=A(13) 口 
和 
6 
b ot 
6 (ab 相同 ,说 明 在 三 维 矩 阵 中 ,第 三 维 的 下 标 为 { 时 可 以 缺 省 ) 
Gs 
一 6 
d= 
4 (采用 单一 下 标 访问 时 , 先 访 问 第 三 维 的 下 标 为 1 者 ,然后 以 此 类 推 》 
EE 
一 4 
3AC : ,2,2)=0 : 2 口 
A(:,:,2)= (也 会 显示 A( : ，: ,1) ,不 过 A( :，: ,1) 结 果 同 上 ,这 里 略 去 ) 
一 1 0 ~-7 
一 2 1 -8 . 
一 3 2 -9 
更 高 维 的 矩阵 的 处 理 也 类 似 . 些 外, 元素 为 字符 串 的 高 维和 矩阵 也 可 以 类 似 定义 和 
处 理 ， 


2.6 结构 变量 


除了 基本 的 数值 矩阵 和 字符 串 抢 阵 外 ,MATLAB 中 还 提供 了 一 些 其 他 较为 复杂 的 
数据 类 型 ,主要 是 结构 (structure) 和 元 胞 矩阵 (cell array). 

结构 变量 是 由 “ 域 ” 组 成 的 变量 ;通过 “. ”操作 符 可 以 访问 结构 变量 的 “ 域 ”. 如 下 面 是 
由 name,fee 和 credit 三 个 域 组 成 的 一 个 结构 变量 的 例子 : 


》student. name='abc ABC'; student.fee= 5000.00; student. credit=!14,3,2,3;85,60,90,70] 口 
student 三 
name : ‘abc ABC 
fee : 5000 
credit : [2x4 double] 
》student, credit] 


ans 一 


2 语句 和 函数 以 及 其 他 数据 类 型 


结构 变量 是 可 以 构 套 的 , 即 结构 中 还 可 以 有 结构 ,如 : 


student. name. firstname = 'abc', student. name. lastname='ABO'D] 
student 三 
name : [1x1 struct] 
fee : 5000 
credit : [2x4 double] 


)》student.name 


ans 三 
firstname ; "abc' 


lastname ; ABC 


此 外 ,除了 上 面 这 种 直接 赋值 的 方式 外 ,结构 变量 也 可 以 通过 struct 函数 生成 ,如 


》student(5) = struct('name', abc ABGC', 'fee', 5000 ,'credit', [4,3,2,3;85,60,90,70]) 口 
student = 
1x5 struct array with fields : 

name 

fee 


credit 


这 样 ,student(5) 的 结果 同上 ;由 于 没有 给 出 student(1) 至 student(4) 的 取 值 ,系统 还 


会 自动 对 结构 变量 student(1) 至 student(4) 的 三 个 “ 域 ” 赋 值 为 空 . 
其 他 有 关 结 构 变 量 的 操作 函数 的 用 法 请 读者 查阅 MATLAB 帮助 文件 或 其 他 书籍 . 


*2.7 元 胞 矩阵 


元 胞 矩阵 可 以 看 成 是 数值 (或 字符 串 ) 矩 阵 的 一 种 自然 而 然 的 扩展 . 在 数值 矩阵 中 ,要 
求 所 有 元 素 都 是 一 个 数 ;在 字符 矩阵 中 ,要 求 所 有 元 素 都 是 一 个 字符 . 而 在 元 胞 矩阵 中 ,不 
同 的 元 素 可 以 有 完全 不 同 的 数据 类 型 ,如 上 面 结构 变量 的 例子 也 可 以 用 如 下 的 方式 定义 
成 元 胞 矩阵 ;: 


"student(1,1) = (abc ABC'} ; student(1,2) = {5000.00});... 口 
student(2,1) = (人 4,3,2,3;85,60,90,70]) 口 


student = 
abc ABC' [5000] 
[2x4 double| 回 


你 可 能 已 经 注意 到 元 胞 矩阵 中 赋值 时 采用 的 是 花 括 号 ,而 不 再 是 方 括号 . 此 外 ,上 面 
的 元 胞 变量 定义 过 程 也 可 以 用 下 面 的 方式 : 


》student{1,2} ='abc ABC' student{1,2} =5000.00; 
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student{2,1} = [4,3,2,3;85,60,90,70] 口 
输出 同上 . 元 素 的 访问 方法 和 规则 与 数值 矩阵 类 似 , 如 : 


》student{ 1,2} 口 
ans = 

5000 
》student{2,1}(1, ; ) 口 
ans = 

4 3 2 3 
》student{2,1)(2，: ) 口 
ans = 

85 60 90 70 
》student{2,1}(4) 口 


ans 三 
60 
与 结构 变量 类 似 , 除 了 上 面 这 种 直接 赋值 的 方式 外 ,元 胞 矩阵 变量 也 可 以 通过 cell 函 
数 生 成 ,如 


》c= cell(2,3) 口 ] 


C 一 


二 
[] [J [0] 
yc{2,1} ='abc'; c{2,3) =5000 口 
Ee 
[J 网 [] 
bc" “二 ] [5000] 


元 胞 变量 也 是 可 以 髓 大 ,的 ,而 且 元 胞 变量 也 可 以 与 结构 变量 相互 柑 套 ,从 而 可 以 用 于 
构造 出 非常 复杂 的 数据 类 型 . 此 外 ,与 普通 数值 矩阵 一 样 , 也 可 以 定义 高 维 ( 三 维 或 以 上 ) 
的 结构 变量 和 元 胞 变量 ， 

其 他 有 关 元 胞 变量 的 函数 的 用 法 请 读者 查阅 MATLAB 帮助 文件 或 其 他 书籍 . 


2.8 数据 类 型 的 判断 和 转换 


目前 ,高 版 本 的 MATLAB 遵循 的 是 面向 对 象 编程 (OOP) 的 规范 ,数据 类 型 是 以 “类 ” 
(class) 的 形式 实现 的 . MATLAB 内 部 已 经 包括 了 比较 丰富 的 适合 于 科学 计算 的 数据 类 
型 ,在 此 基础 上 也 人 允许 用 户 建立 新 的 数据 类 型 . MATLAB 中 最 一 般 的 类 是 array 类 (可 以 
译 为 阵列 ,不 过 我 们 这 里 还 是 将 它 称 为 矩阵 ) ,array 可 以 是 列 出 全 部 元 素 的 稠密 (full) 和 珑 
阵 形式 或 是 稀 朴 (sparse) 和 矩阵 形式 .内 部 的 具体 数据 类 型 可 以 归纳 成 表 1: 


2 语句 和 函数 以 及 其 他 数据 类 型 


double ( 双 精 度 ) ,single ( 单 精度 ) 


int8 (8 位 整数 ) ,uint8( 无 符号 8 位 整数 ) 

numeric (数值 型 ) int16 (16 位 整数 ) ,uint16( 无 符号 16 位 整数 ) 
int32 (32 位 整数 ) ,uint32( 无 符号 32 位 整数 ) 
int64 (64 位 整数 ) ,uint64( 无 符号 64 位 整数 ) 


于 


char (字符 型 ) 

logical (逻辑 型 ) 
struct (结构 ) (用 户 自 定义 的 类 ) 
cell (元 胞 ) 
function_handle( 函数 句柄 ) (” @ 十 函数 名 ”) 


java (Java 类 ) 


对 于 一 个 变量 ,有 时 候 希 望 判 定 它 是 属于 哪个 类 的 对 象 , 这 时 可 以 有 几 种 不 同 的 判断 


方法 . 首先 ,可 以 使 用 class 函数 直接 返回 变量 类 型 . 例如 ,对 于 上 节 定 义 的 元 胞 变量 c: 
》t=[class(c)，， class(c(2,1))， ',class(c{2,2})),' ',class(c{2,3}) | 口 
外 这 

celi char double double ( 缺 省 时 , 空 矩阵 c(2,2} 也 被 认为 是 双 精 度数 值 型 ) : 
isa(obj,'class_name') 


这 个 函数 判断 对 象 obj 是 否 属 于 class_name 类 (结果 中 1 表示 “是 ”,0 表示 “ 否 ”), 其 中 
class_name 是 类 名 ,可 以 是 表 1 中 的 17 种 (英文 ) 类 名 之 一 .例如 ,对 于 上 节 定 义 的 元 胞 变 
量 c: 
3t= [isa(c,'cell) , isa(c, 'struct') , isa(c{2,1},'char’), isa(c{2,3},'double'’) 1O. 
中 -= 
1 0 1 1 


此 外 ,numeric,char,iogical,struct,celi,java 类 也 可 以 用 对 应 于 每 类 的 具体 函 数 直接 : 


判断 ,这 个 函数 名 是 “is+ (英文 ) 类 名 ”. 例如 ,isa(c,'cell') 命 令 等 价 于 iscell(c); 而 
isa(c{2,1}),'char') 命令 等 价 于 ischarC(c{2,1})), 以 此 类 推 . 

以 上 许多 数据 类 型 之 间 可 以 相互 转换 ,所 以 转换 类 型 的 函数 很 多 .下 面 仅 以 数值 型 和 
字符 型 相关 的 转换 举 几 例 简 单 演示 如 下 : 


)clear all; A = magic(4); B = singie(A); whos 口 (显示 当前 工作 区 中 的 所 有 变量 ) 
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Name Size Bytes Class 
A 4x4 128 double array 
B 4x4 64 Single array 


Grand total is 32 elements using 192 bytes 
3》a= —2 :0.8:2,b=int8(a), c=uini8 (a) 口 


a= 
一 2.0000 一 1.2000 一 0.4000 0.4000 1.2000 2.0000 
| 
二 六 一 1 0 0 1 2 
c= 
0 0 0 0 1 2 
»》d='3.14159e0'; str2num(d) 口 
ans = 
3.1416 
》str2num([ 1 2';'3 49) 口 
ans 三 
1 2 
3 4 
》A= reshape(1 : 9,3,3); B= logical(eye(3)); A(B)' 口 E 
ans = 
1 5 9 
》e= @sin;func2str(e) 口 
ans = 
sin 
f= 'cos'; str2func(f) 口 
ans = 
@cos 


3 命令 和 窗口 环境 


本 节 将 介绍 MATLAB 的 在 线 帮助 系统 、 一 些 特殊 命令 及 窗口 环境 . 
3.1 在 线 帮 助 系统 
MATLAB 提供 了 非常 方便 的 在 线 帮助 ,如 果 你 知道 某 个 程序 (或 主题 ) 的 名 字 , 就 可 


用 命令 
help 程序 (主题 ) 名 
得 到 帮助 ,例如 


》help sqrt 口 


SQRT Square root. 
SQRT(X) is the square root of the elements of X. Complex 


results are produced if X is not positive. 


See also SQRTM. 


Overloaded functions or methods (ones with the same name in other directores) 


nelp symysqrt. m 


Reference Page in Help browser 


doc sqrt 


单独 使 用 help 命 


令 ,MATLAB 将 列 出 所 有 的 主题 . MATLAB 还 提供 了 一 个 命令 


lookfor, 它 可 以 搜索 包含 某 个 关键 词 的 帮助 主题 ,这 个 关键 词 并 不 一 定 要 求 是 MATLAB 


的 命令 或 函数 . 


不 过 在 WINDOWS 系统 下 ,一般 来 说 ,使 用 窗口 中 的 help 菜单 获得 帮助 信息 是 更 完 


整 、 更 方便 的 . 


3.2 数据 显示 格式 
MATLAB 显示 数据 结果 时 ， 


数据 是 实数 ,在 缺 省 情况 下 显示 小 数 点 后 4 位 数字 . 


可 以 打开 菜单 File 下 的 子 菜 单 Preferences, 来 选择 


一 般 遵 循 下 列 原 则 :如 果 数 据 是 整数 , 则 显示 整数 ;如 果 


\ 改 变数 据 显示 的 方式 (修改 


Numeric format 下 拉 框 ), 以 的 显示 为 例 将 常用 的 方式 列 如 表 2: 


表 2 


MATLAB 命令 


说 明 


format short 


3.1416 s 小 数 点 后 4 位 ( 缺 省 显示 ) 


format long 3. 14159265358979 15 位 数字 

. format bank 3.14 诈 ， 小 数 点 后 2 位 
format 十 十 显示 十 ,一 或 0 
format short e 3 1416e+ 000 5 位 科学 计数 法 


format long e 


3. 141592653589793e 十 000 


15 位 科学 计数 法 


format rat 或 rational 


format hex 


355/113 最 接近 的 有 理 数 
400921 十 654442d18 十 六 进 制 数 (IEEE 标准 ) 


本 
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也 可 以 直接 键 人 表 2 中 第 1 列 的 MATLAB 命令 选择 显示 的 方式 .format 只 影响 结果 的 
显示 ,不 影响 计算 和 存储 . MATLAB 总 是 以 双 精 度 执行 所 有 的 运算 . 
3.3 命令 行 编辑 

键盘 上 的 各 种 箭头 和 控制 键 为 我 们 提供 了 命令 的 重 调 、 编 辑 . 重 用 功能 ,具体 用 法 


如 下 : 

不 ctrl-p 重 调 前 一 行 《用 于 调 出 前 面 的 命令 进行 修改 ,重新 计算 ) 

y ctrl-n 重 调 下 一 行 

-人 ctrl-b 向 前 移 一 个 字符 

二 ctrl-f 向 后 移 一 个 字符 
ctrl-r 右 移 一 个 字 
ctrl-l 左 移 一 个 字 

home ctrl-a 移动 到 行 首 

end ctrl-e 移动 到 行 尾 

esc ctrl-u 清除 一 行 

del ctrl-d 删除 光标 处 字符 

backspace ctrl-h 删除 光标 前 的 一 个 字符 


ctrl-kK- 删除 到 行 尾 
3.4 MATLAB 命令 窗口 


MATLAB 命令 窗口 是 用 来 接受 MATLAB 命令 的 窗口 ,可 以 在 窗口 中 用 命令 实现 


以 下 功能 . 
。 显示 
}who[D 
或 
》whos 口 ] 


可 以 显示 在 当前 工作 区 中 的 所 有 变量 名 ,其 区 别 是 前 者 只 显示 变量 名 ,后 者 还 显示 变量 的 
大 小 、 字 节 数 和 类 型 . 


3》disp(x) 口 
显示 z 的 内 容 , 它 可 以 是 矩阵 或 字符 串 . 
。 清除 


》clear 品 ] 


清除 当前 工作 区 的 所 有 变量 ,如 果 只 要 清除 一 个 变量 ,可 以 用 

》clear (变量 名 ) 口 

。 储存 

)save (文件 名 ) 口 
把 工作 区 中 的 变量 储存 在 当前 MATLAB 目录 下 产生 的 一 个 扩展 名 为 mat 的 MAT 文件 
中 ,也 可 以 用 File 菜单 中 的 Save Workspace as .… 完 成 同样 的 工作 . 

。 调 出 

)ioad (文件 名 ) 
可 以 调 出 MAT 文件 中 的 数据 .load 命令 也 可 以 调 出 文本 文件 ,但 是 文本 文件 只 能 是 由 数 
字 组 成 的 矩阵 形式 ,例如 ,你 可 以 在 MATLAB 外 建立 一 个 形 如 


16.0 3.0 2.0 11.0 
4.0 10.0 23.0 9.0 
9.0 - 6.5 7.4 12.0 


的 文本 文件 ,文件 名 为 magik. dat, 那 么 命令 


》load magik.dat 


把 文件 读 人 并 建立 一 个 名 为 magik 的 变量 , 它 的 值 为 上 述 和 矩阵. 

当 用 文本 形式 保存 工作 区 时 ,应 当 每 次 仅 保存 一 个 变量 . 如 果 多 于 一 个 , MATLAB 
也 可 产生 文本 文件 ,但 是 你 无 法 用 load 命令 把 它 调 回 MATLAB. 

。 记录 

MATLAB 还 提供 了 一 个 diary 命令 , 它 可 以 建立 一 个 文本 文件 记录 下 你 在 
MATLAB 中 输入 的 所 有 命令 和 它们 的 输出 ,但 是 不 能 包括 图 形 . 使 用 diary 命令 可 以 建 
立 一 个 名 为 diary 的 文件 ,如 果 想 把 你 的 输入 存 人 一 个 特定 的 文件 中 ,可 使 用 


)diary filename[ 


建立 文件 . 使 用 


》diary offD 
命令 可 以 停止 记录 . 
。 搜索 
MATLAB 用 -一 系列 目录 作为 搜索 路 径 , 以 此 来 决定 如 何 执行 你 调用 的 函数 ,命令 
》path 吕 ] 


显示 目前 的 搜索 路 径 , 你 可 以 用 File 菜单 中 的 Set Path 观察 和 修改 路 径 . 


gl 
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。 管 理 
MATLAB 还 提供 了 一 系列 管理 文件 的 命令 : 
What 返回 当前 目录 下 M, MAT，MEX 文件 的 列表 
dir, ls 列 出 当前 目录 下 的 所 有 文件 
cd,path 改变 当前 目录 为 path( 与 改变 桌面 上 “Current Directory” 功 能 相同 ) 
cd,pwd 显示 目前 的 工作 目录 
. type test 在 命令 窗口 下 显示 test. m 的 内 容 
delete test 删除 M 文件 test. m 
which test 显示 M 文件 test. m 的 目录 
。 退出 
退出 工作 区 可 以 用 
》quit 


也 可 选择 File 菜单 中 的 Exit 命令 (快捷 键 Ctrl 十 Q) 或 直接 点 击 窗口 上 的 “X” 按 钮 
4 图形 功 能 


MATLAB 系统 提供 了 丰富 的 图 形 功能 ,下 面 着 重 介绍 二 维 图 形 的 画 法 ,对 三 维 图 形 


只 作 简 单 叙述 . . 
从 本 节 起 在 不 致 引起 混淆 的 情况 下 输入 命令 的 前 后 不 再 写 出 “》” 和 “ 口 " 符 号 . 
4.1 二 维 图 形 
。 基本 形式 


MATLAB 最 常用 的 画 二 维 图 形 的 命令 是 plot, 看 两 个 简单 的 例子 : 


y=[0 0.58 0.70 0.95 0.83 0.25]; plot(y) 


生成 的 图 形 见 图 2, 是 以 序号 1,2,… ,6 为 横 坐 标 .数组 y 的 数值 为 纵 坐 标 画 出 的 折线 . 


x= linspace(0,2 x pi,30); y= sin(x); plotCx,y) 
生成 的 图 形 见 图 3, 是 [0,2x] 上 30 个 点 连 成 的 正弦 曲线 . 
多重 线 
在 同一 个 画面 上 可 以 画 许多 条 曲线 ,只 需 多 给 出 几 个 数组 ,例如 


x=0 : pi/15 : 2 x pi; yl= sin(x); y2= cos(x); plotC(x,y1,x,y2) 


或 者 给 出 矩阵 ,如 


x=0: pi/15 : 2x pi; y=[sin(x)y;cosCx)];i plotCx,y) 


[0 4 a 1 1 | 
N015202530 354045505.560 
图 2 图 3 
都 可 以 画 出 图 4. 


多 重 线 的 另 一 种 画 法 是 利用 hold 命令 .在 已 经 画 好 的 图 形 上 , 若 设 置 hold on， 
MATLAB 将 把 新 的 plot 命令 产生 的 图 形 画 在 原来 的 图 形 上 .而 命令 hold off 将 结束 这 个 
过 程 . 例如 : 


x= linspace(0,2*x pi,30); y= sin(x); plotCx,y) 


先 画 好 图 3, 然 后 用 


hold on,z= 0 * xi plotCx,z), hold off 


命令 增加 一 条 横 线 的 图 形 ,得 到 图 5. 


。 线 型 和 颜色 

MATLAB 对 曲线 的 线 型 和 颜色 有 许多 选择 ,标注 的 方法 是 在 每 一 一 加 一 个 
字符 串 参 数 ,说 明 如 下 . 

线 型 ” 线 方式 :一 实 线 ; : 点 线 ; -. 虚 点 线 ; -- 波折 线 . 
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线 型 ”点 方式 :  . 圆 点 ; 十 加 号 ; * 星 号 ; Xx 叉 号 ; 0o 小 圆圈 ; d 钻石 ; 
s 方形 ; Pp 五 角 星 ; h 六 角 星 ; v 下 三 角 ; “上 三 角 ; ”二 左 三 角 ; 右 三 


颜色 ，y 黄 ; r 红 ; g 绿 ; b 蓝 ; w 白 : K 黑 ; m 紫 ! c 青 . 

以 下 面 的 例子 说 明 用 法 : 

x=0: pi/15: 2 x pi; yl= sin(x); y2= cos(x); plotC(x»y1,'b : ',x,y2,'9—.") 
得 到 图 4( 线 型 和 颜色 不 同 ). 如 果 将 plot 的 内 容 写 成 

plotCx,yl,'b : ',x,y2,'9— .' ,X,Yy1,'+', x,y2,'%*') 


可 得 图 6. 
。 网 格 和 标记 
在 一 个 图 形 上 可 以 加 网 格 .标题 `X 轴 标 记 、Y 轴 标 记 , 用 下 列 命令 完成 这 些 工 作 . 
x= linspace(0,2x pi,30); y= sin(x) ; z= cos(x); 
plotCx,y,x,z) 
grid 
xlabel('independent Variable X') 
ylabel('Dependent Variables Y and Z0) 
titleC'Sine and Cosine Curves') 


它们 产生 图 7. 
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图 7 


可 以 在 图 形 的 任何 位 置 加 上 一 个 字符 串 , 如 用 
textC2.5,0.7,'sinx’) 


表示 在 坐标 zx 一 2.5,y 一 0.7 处 加 上 字符 串 sinx. 


4 图 形 功 能 


更 方便 的 是 用 鼠标 来 确定 字符 串 的 位 置 , 方 法 是 输入 命令 ， 
gtextC'sinx') , gtext('cosx') 


在 图 形 窗口 十 字 线 的 交点 是 字符 串 的 位 置 , 用 鼠标 点 一 下 就 可 以 将 字符 串 放 在 那里 ,如 
图 8. 

当 需 要 标记 的 字符 串 是 希腊 字母 ,特殊 符号 、 上 下 标 及 设 定 字体 式样 时 ,可 参见 表 3 
《要 知道 得 更 多 请 参看 文献 [4]) : 


表 3 

指令 | 效果 | 指令 | 效果 | 指令 | 效果 指令 效果 
\alpha a \lambda 入 \geq 之 | Niter 一 ty)sint e'sint 
\beta B Amu 站 \leq < \itx_{1} Ct) x1Ct) 
\delta 人 Nrho \pm 士 NbfExample Example 
\Delta A \sigma G Npropto oo \itExample Example 
\theta 0 \phi 中 Ntimes x \fontsize{ 14} 
\Theta Q \omega 四 Npattial 9 Example E xample 


。 坐标 系 的 控制 

在 缺 省 情况 下 MATLAB 自动 选择 图 形 的 横 、 维 坐标 的 比例 ,如 果 你 对 这 个 比例 不 满 
意 ,可 以 用 axis 命令 控制 ,常用 的 有 : 

axis(Lxmin xmax ymin ymax]) [中 分 别 给 出 x 轴 和 y 轴 的 最 小 .最 大 值 

axis equal 或 axisCequal] x 轴 和 y 轴 的 单位 长 度 相 同 

axis square 或 axis('square') 图 框 呈 方形 

axis off 或 axis(Coff) 清除 坐标 刻度 

还 有 axis auto axis image axis xy axis i axis normal axis on axis 
(axis) 

用 法 可 参考 在 线 帮助 系统 . 

请 看 下 例 : | 


x=0: pi/15 : 2 x pi;plotCsinCx) ,cos(x)) ,axis equal,axis([—1 1 0 .1 


画 出 的 图 形 如 图 9. 

。 多 幅 图 形 

可 以 在 同一 个 画面 上 建立 几 个 坐标 系 ,用 subplotC(m,n,p) 命 令 把 一 个 画面 分 成 mXn 
个 图 形 区 域 ,p 代表 当前 的 区 域 号 ,在 每 个 区 域 中 分 别 画 一 个 图 ,如 
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x= linspace(0,2x*x pi,30); y= sin(x); Z= cos(x); 


U=2 x sin(x). x cos(x); v= sin(x). /cos(x); 
subplot(2,2,1), plotCx,y), axis([0 2xpi 一 1 
subplot(2,2,2), plot(x,z), axis([0 一 ] 
subplot(2,2,3), plot(x,u), axis([0 2xpi 一 1 
subplot(2,2,4), plot(x,v), axis([0 2xpi 


得 到 2X2 共 4 幅 图 形 , 见 图 10. 


2xpi 


sin(x 
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， 极 坐标 图 形 


1]), titleC'sin(x)") 
1]), titleC'cos(x)') 
1]), titleC'2sin(x)cosCx)') 


一 20 20]), titleC'sin(x)/cos(x)'") 


cos(X) 
0 2 4 6 
0 sin(x)/cos(x) 
10 
0 
-10 
-20 
0 2 4 6 » 


1.0 


用 polar 函数 可 以 画 出 极 坐标 图 形 , 如 对 于 p 二 0.5|sin4z| 在 一 个 周期 内 的 曲线 , 用 


以 下 程序 实现 : 


t=0 :0.01:2*pi; 


polar(t,0.5* abs(sin(4 x t))) 


画 出 的 图 形 如 图 11. 


。 其 他 

还 有 一 些 画 二 维 图 形 的 命令 ,如 

fplot(@fun,[xmin xmax ymin ymaxj) 在 [xmin xmax] 内 本 出 以 字符 串 fun 表示 的 函数 的 图 形 ， 
[ymin ymaxj 给 出 了 y 的 限制 


semilogx(x,y) 半 对 数 坐 标 ,x 轴 为 常用 对 数 坐 标 
semilogy (x,y) 半 对 数 坐 标 ,y 轴 为 常用 对 数 坐 标 
loglog(x,y) 全 对 数 坐 标 


其 他 一 些 画 特殊 二 维 图 形 ( 极 坐标 图 、 条 形 图 等 ) 的 命令 请 查阅 在 线 帮助 系统 . 
图 12 是 用 命令 fplot 按 以 下 程序 画 出 的 图 形 , 可 以 看 出 它 的 方便 之 处 . 


fplotC'sinCx). /x',[—20 20 一 0.4 1.2]), gtext('sinx/x') 


最 后 ,如 果 你 在 一 段 程序 中 画 了 几 个 图 形 ,需要 逐个 观察 ,那么 应 该 在 每 两 个 plot 合 
令 之 间 加 一 个 pause 命令 , 它 暂停 命令 的 执行 ,直到 你 击 下 任何 一 个 键 
4.2 三 维 图 形 


只 对 几 种 常用 的 命令 通过 例子 作 简单 介绍 . 
。 带 网 格 的 曲面 
例 作曲 面 x 二 f(z,y) 的 图 形 ， 
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v .一 


< 2 2 

i et 7.5<rE7.5, —7.5<yS7.5. 
VT Fy 

用 以 下 程序 实现 : 

x=—7.5:0.5:7.5; y=x; 

[X,Yj]=meshgrid(x,y); “三维 图 形 的 X,Y 数组 ) 

R= sqrt(X."2 二 Y.2) 十 epsi Z=sin(R)./R; (加 eps 是 防止 出 现 0/0) 

mesh(X,Y,Z) (三 维 网 格 表面 ) 


画 出 的 图 形 如 图 13. mesh 命令 可 以 改 为 surf, 图 形 效果 有 所 不 同 ， 


。 空间 曲线 


例 ” 作 螺旋 线 z 一 sint,y 一 cost,z 一 上 

用 以 下 程序 实现 : 

t=0 : pi/50 : 10 x pi; 

plot3(sinCt) ,cos(t) ,t) (空间 曲线 ,用 法 类 似 于 plot) 

画 出 的 图 形 如 图 14. 

。 等 高 线 

用 contour 或 contour3 画 曲面 的 等 高 线 ,quiver 画 出 速度 场 .如 对 图 13 的 曲面 ,在 上 
面 的 程序 后 接 


contour (X,Y,2,10) 
QuiverCX,Y) 


即 可 得 到 10 条 等 高 线 如 图 15, 速 度 场 如 图 16. 

。 其 他 

较 有 用 的 是 给 三 维 图 形 指定 观察 点 的 命令 view(azi,ele) ,azi 是 方位 角 ,ele 是 仰角 . 
人 缺 省 时 azi== 一 37. 5",ele 二 30". | 


5 程序 设计 


5 程序 设计 


MATLAB 提供 了 一 个 完善 的 程序 设计 语言 环境 ,使 我 们 能 方便 地 编制 复杂 的 程序 ， 
完成 各 种 计算 . 本 节 先 简要 介绍 关系 运算 .逻辑 运算 ,以 及 条 件 和 循环 语句 等 许多 高 级 语 
言 都 具备 的 、 编 程 的 重要 手段 ,再 着 重 介绍 MATLAB 所 特有 的 M 文件 ， 


5.1 关系 运算 


MATLAB 的 关系 运算 符 有 : 

二 小 于 ; ”这 大于; 所 = 小 于 或 等 于 ; 过 = 大 于 或 等 于 ; ”三 = 等 于 ; 一 = 不 
< 
关系 运算 比较 两 个 数值 , 当 指出 的 关系 成 立时 结果 为 1( 表 示 真 ) ,否则 为 0( 表 示 假 ). 

关系 运算 可 以 作用 于 两 个 同样 大 小 的 矩阵 或 数组 ,结果 是 一 个 0-1 矩阵 或 数组 ,每 个 
分 量 代表 相应 的 矩阵 或 数组 分 量 的 关系 运算 结果 ,例如 


3A=1:5,B=5:—1: 1 


A= 

1 2 3 4 5 
B= 

5 4 3 2 1 
C= A> =40] 
C= 


0 0 0 1 1 
》B(C) 口 (逻辑 变量 作用 于 矩阵 或 数组 ) 
al = 

2 1 
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)D=A= =B 口 
D = 
0 0 1 0 0 
需要 注意 的 是 :对 空 矩阵 的 判别 需要 用 函数 isempty, 如 : 


YE=[]; F=isempty(E) 口 (如 果 用 F=E= =[], 不 能 得 到 正确 的 答案 ) 
FE 


1 


下 面 再 介绍 一 个 很 有 用 的 函数 find, 见 例子 : 


》A = magic(4) 口 


A= 

16 2 3 13 

5 11 10 8 

9 7 6 12 

4 14 15 1 
)i = find(A> 12) 口 〈 按 列 找 出 A 中 大 于 12 的 元 素 的 位 置 ) 
i = 

1 

8 

12 

13 
A(i) = 100 口 (与 直接 使 用 A (A 二 12) = 100 的 效果 相同 ) 
A = 


100 2 3 100 


[row, col] = find(A> 12) ;row', col'D 
row = 
1 4 4 1 
col = . 
1 2 3 4 
find(A) 相 当 于 find(A 二 0). 


下 面 举 一 个 例子 说 明 如 何 将 关系 运算 和 数值 运算 结合 起 来 . 
)x=(-3 : 3)/3 口 


X 一 
一 1.0000 一 0.6667 一 0.3333 0 0.3333 0.6667 1.0000 


5 程序 设计 


》sinCx) . /x 
Warning : Divide by zero 


ans 三 
0.8415 0.9276 0.9816 NaN 0.9816 0.9276 0.8415 


在 计算 sinz/z 时 给 出 了 警告 信息 ,是 因为 第 4 个 数据 sin0/0 没有 定义 ,MATLAB 返回 
NaN. 为 了 避免 这 种 情况 出 现 可 以 用 最 小 浮 点 数 eps 来 代替 0, 即 


x=(—3 :3)/3;x=x+(x= =0) x eps; sin(x). /x 
ans = 0.8415 0.9276 0.9816 1.0000 0.9816 0.9276 0.8415 


-给 出 了 sinz/z 在 x 二 0 时 正确 的 极限 值 . 
5.2 逻辑 运算 
MATLAB 的 逻辑 运算 符 有 : 
& 与 运算 ; | 或 运算 ; 一 韭 运 算 ; xor ” 异 或 运算 . 
上 述 运 算 本 质 上 是 标量 运算 , 当 作 用 于 两 个 同样 大 小 的 矩阵 或 数组 时 ,结果 是 一 


0-1 和 矩阵 或 数组 ,每 个 分 量 代表 相 应 的 矩阵 或 数组 分 量 的 关系 运算 结果 . 而 
运算 规则 ( 见 表 4) ; 


表 4 

a b | a&b 或 and(a,b) ailb 或 or(a,b) 一 a 或 not(a) xor(a,b) 

0 0 0 0 1 0 
1 0 0 1 0 | 1 

0 J 0 1 Hi 1 

1 1 1 1 0 


逻辑 运算 将 任何 非 零 元 素 视 为 1( 真 ). 逻辑 运算 可 以 作用 于 矩阵 或 数组 ,请 看 下 例 ， 


9, b=9-—a, c=~(a>4), d= (a> =3)&(b<6), e=xor(c,d), f=a(d), a(d)= 10 吕 DD 
5 6 7 8 


=1T: 

a=1 2 3 4 9 

b=8 7 6 5 4 3 2 1 0 

c=1 1 1 1 0 0 0 0 0 

d=0 0 0 1 1 1 1 1 1 

e=1 1 1 0 1 1 1 1 1 

f=4 5 6 7 8 9 

a=1 2 3 10 10 10 10 10 10 

与 运算 (& ) 和 或 运算 (| ) 均 有 所 谓 的 “短路 "版 本 ， 运算 符 分 别 为 & &” 和 “|” 程序 
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在 执行 “a& &b” 时 ,如 果 a=0, 则 直接 得 到 计算 结果 为 0; 程 序 在 执行 “al| b” 时 ,如果 
a 二 1, 则 直接 得 到 计算 结果 为 1. 也 就 是 说 ,在 这 两 种 情况 下 ,不 再 考虑 5b 是 否 有 意义 ,更 
不 关心 5 的 取 值 ,这 在 有 时 候 是 很 有 好 处 的 . 如: 

)z = (x ~= 0) && (y/x > 15) 口 
可 以 避免 x 二 0 时 系统 给 出 除数 为 0 的 警告 信息 . 

MATLAB 还 提供 了 一 些 逻 辑 函 数 ,常见 的 有 all 和 any, 用 法 是 : 

y= all(x) 若 x 为 向 量 , 当 所 有 元 素 非 零 时 y=1, 否 则 y=0; 若 x 为 矩阵 ,all 作用 于 列 元 素 ,y 


为 行 向 量 . 

y= any(x) 若 x 为 向 量 , 当 有 一 元 素 非 零 时 y=1, 否 则 y=0; 车 x 为 矩阵 ,ail 作用 于 列 元 素 ,y 
为 行 向 量 . 

例如 : 

》a=[1 0 -5 0;-3 0 8 2], b=all(a), c=any(a), d=all(b), e=any(c) 

a= 1 0 一 0 

一 入 0 8 2 

b= 1 0 1 0 

c 1 0 1 1 

d= 0 

e 三 1 


MATLAB 还 提供 了 按 二 进 制 位 进行 计算 的 位 运算 函数 ,主要 有 4 种 : 
bitand 按 位 与 运算 ; bitor 按 位 或 运算 ; ”bitcemp 按 位 补 运算 ; bitxor 按 位 异 或 


用 法 举例 如 下 : 

)A = 28; B = 21; (分别 相当 于 二 进 制 11100;10101) 
》LbitandCA,B) ，bitor(A,B) ，bitcmp(A,5) ,bitxor(A,B)] 

ans 三 


20 29 3 920 (分 别 相当 于 二 进 制 10100;11101;00011;01001) 


5.3 条件 和 循环 语句 

条 件 和 循环 语句 属于 流 控 制 语句 ,MATLAB 的 流 控 制 语句 主要 有 4 个: if, switch， 
while, for, 它 们 都 用 end 结束 . 

。 if 语句 

条 件 语 句 if 最 简单 的 用 法 是 : 

if ”过 关系 表达 式 沁 


< 语句 1> 
end 


如 果 关 系 表达 式 的 值 为 1, 则 语句 1 执行 ;否则 ,执行 end 的 后 续 命 令 . 


if 语句 的 另外 一 种 用 法 是 : 
if . << 关系 表达 式 >> 
过 语句 1 
else 
达 语 名 2 之 
end 


5 程序 设计 


如 果 关 系 表达 式 的 值 为 1, 则 语句 1 执行 ;否则 (关系 表达 式 的 值 为 0) ,语句 2 执行 ,然后 


执行 end 的 后 续 命 令 . 
当 我 们 有 多 个 选择 时 还 可 以 用 下 列 结构 : 


计 过 关系 表达 式 1> 
过 语句 1 之 

elseif 过 关系 表达 式 2 之 
之 语句 2 之 


eiseif 过 关系 表达 式 n> 
二 语句 n>> 
else 
过 语句 n+ 1> 
end 


如 果 关 系 表达 式 j(j 王 1,2,…,n) 的 值 为 1, 则 语句 7 执行 ,然后 执行 end 的 后 续 命 令 ; 否 


则 ,语句 n+1 执行 ,然后 执行 end 的 后 续 命令 . 例如 ,可 用 以 
下 程序 得 到 图 17 的 分 段 函数 ， 


if x< =0 
y=0; 
elseif XE 
y=x 
else 
y 一 1 
end 


。 switch 语句 


switch 语句 根据 表达 式 的 值 来 执行 相应 的 语句 ,用 法 如 下 : 


423 


ES 


附录 MATLAB 使 用 入 门 


switch 二 表 达 式 二 


case value1 

过 语句 1> 
case value2 

去 语句 2> 
otherwise 

过 语句 n> 
end 


。 for 语句 
循环 语句 for 的 一 般 形式 为 
for “去 循环 参数 >= < 去 初 值 > : 去 步 长 > : 去 终 值 > 
过 语句 过 
end 
步 长 为 1 时 可 以 省 略 . 对 于 每 一 参数 值 ,语句 都 重复 执行 . 
当 作 多 重 循环 时 for 语句 可 以 散 套 使 用 ,如 用 以 下 程序 可 以 生成 希 尔 伯 特 矩阵 . 
》for i=1:3 


for j=1:4 
ali,)=1/(it+j— 1); 

end 

end 

format rat 

ar 

a= 

1 1/2 1/3 1/4 


1/2 1/3 1/4 1/5 
1/3 1/4 1/5 1/6 


for 语句 的 循环 参数 可 以 是 任意 的 数组 或 矩阵 ,循环 参数 依次 取 数 组 元 素 的 值 ,或 按 
矩阵 的 列 依次 取 值 . 

。 while 语句 2 

for 循环 主要 应 用 于 已 知 循环 次 数 的 情况 ,如 果 不 知 道 循环 次 数 , 可 以 使 用 while 循 
环 来 完成 ,其 表达 方式 为 


while 达 关 系 表达 式 之 
之 语句 二 
end 


5 程序 设计 


当 关 系 表达 式 的 值 为 1( 真 ) 时 ,语句 被 反复 执行 ,直至 关系 表达 式 为 0( 假 ) 时 终止 ,如 


n=0;EPS= 1; 
while (1+ EPS)>1 
EPS= EPS/2; 
n 一 n 十 1; 
end 
EPS=2 x EPS; | 
n,format short e, EPSD 
n= 
53 
EPS = 
2.2204e 一 016 


这 个 例子 给 出 了 计算 MATLAB 中 特殊 常量 eps 的 过 程 ( 我 们 用 大 写 EPS 以 便 与 
”eps 相 区 别 ). EPS 不 断 地 被 2 除 直 到 (1 十 EPS) >1 为 假 时 终止 .这 里 需要 注意 的 是 ， 
MATLAB 用 16 位 数 来 表示 数据 ,因此 当 EPS 接近 10 8 时 , 它 会 认为 (1 士 EPS) 之 1 不 
成 立 . 
MATLAB 还 提供 了 跳出 循环 的 break 语句 , 遇 到 此 语句 立即 执行 此 循环 end 的 后 
续 语 句 , 如 上 面 计算 eps 的 程序 可 以 改 为 : 
EPS= 1; 
for n=1: 100 
EPS= EPS/2; 
if (1+EPS)<=1 
EPS=2* EPS: 
break 
end 
end 


n,format short e ,EPS 站 


得 到 同样 的 结果 . 

MATLAB 还 提供 了 跳出 循环 中 当前 迭代 的 continue 语句 , 遇 到 此 语句 立即 执行 此 
循环 的 下 一 次 达 代 ， 

。 try 语句 

该 语句 的 表达 方式 为 

try 

之 语句 1> 
catch 
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过 语句 2 之 
end 


正常 情况 下 ,只 有 语句 1 被 执行 ; 当 执 行 语句 1 时 如 果 出 现 错误 , 则 将 错误 信息 写 入 
字符 数组 lasterr, 并 转向 执行 语句 人 


5.4 脚本 M 文件 


到 现在 为 止 我 们 都 是 在 MATLAB 命令 窗口 中 输入 数据 和 命令 进行 计算 的 ,这 种 方 
法 在 处 理 比较 复杂 的 问题 和 大 量 的 数据 时 相当 困难 . MATLAB 提供 的 解决 办 法 是 , 先 在 
一 个 以 m 为 扩展 名 的 M 文件 中 输入 数据 和 命令 ,然后 再 让 MATLAB 执行 这 些 命令 . M 
文件 有 两 种 类 型 :脚本 M 文件 和 函数 M 文件 . 
脚本 M 文件 实际 上 是 一 系列 命令 的 集合 (也 可 能 会 输出 结果 或 图 形 ) ,建立 的 变量 保 
存在 内 存 中 ,可 以 在 命令 窗口 中 察看 和 使 用 (除非 用 清除 命令 清除 ). 一 个 比较 复杂 的 程序 
常常 要 作 反 复 的 调试 ,这 时 你 不 妨 建立 一 个 文本 文件 并 把 它 储存 起 来 ,可 以 随时 调用 进行 
计算 .建立 脚本 文件 可 以 在 File 菜单 中 选择 New, 再 选择 M-file, 这 时 MATLAB 将 打开 
一 个 文本 编辑 和 调试 窗口 ,在 这 里 输入 命令 和 数据 . 储存 时 文件 名 遵循 MATLAB 变量 命 
名 的 原则 (请 特别 注意 不 能 以 数字 开头 ) ,但 必须 以 m 为 扩展 名 ,其 一 般 形式 为 


二 M 文 件 名 盖 .m 


如 hilbl. m，pp.m 等 . 

值得 注意 的 是 ,脚本 M 文件 中 的 变量 都 是 全 局 变量 ,在 执行 过 程 中 , 脚本 M 文件 中 
的 命令 可 以 使 用 目前 工作 区 中 的 变量 , 它 所 产生 的 变量 也 将 成 为 工作 区 的 一 部 分 . 比如 生 
成 希 尔 伯 特 矩 阵 的 程序 可 以 写成 如 下 的 脚本 M 文件 : 


”fori=1:m 
for j=1:n 
ali,)=1/0+j— DD); 
end 
end 


a= rats(a); 


命名 为 hilbl. m 储存 起 来 ,那么 当 需 要 一 个 2X3 希 尔 伯 特 扼 阵 时 ,可 以 在 MATLAB 命 
令 窗口 中 进行 : 
)m=2,n=3,hilb1,a 口 
a = 
1 1/2 1/3 
/2 1/3 1/4 
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5.5 项 数 M 文件 


函数 M 文件 是 另 一 类 M 文件 ,我 们 可 以 根据 需要 建立 自己 的 函数 文件 ,它们 能 够 像 
库 函 数 一 样 方便 地 调用 ,从 而 极 大 地 扩展 MATLAB 的 能 力 . 如 果 对 于 一 类 特殊 的 问题 ， 
建立 起 许多 函数 M 文件 ,就 能 最 终 形成 独立 的 工具 箱 . 

。 函数 M 文件 的 基本 用 法 

函数 M 文件 的 第 一 行 有 特殊 的 要 求 ,其 形式 必须 为 

function ”< 到 因 变 量 >= 过 函数 名 汪 ( 二 自 变量 沁 ) 

其 他 各 行为 从 自 变量 计算 因 变 量 的 语句 ,并 最 终 将 结果 赋予 因 变量 . 这 个 M 文件 的 
文件 名 必须 是 < 函数 名 > m (MATLAB6. 5, 1 对 此 已 经 有 所 放松 , 即 当 函 数 名 与 文件 名 
不 同时 ;忽略 文件 中 定义 的 函数 名 ;但 建议 还 是 保持 两 者 名 称 一 致 为 好 ). 下 面 给 出 函数 文 
件 的 一 个 简单 例子 

如 果 我 们 经 常 要 调用 这 样 的 随机 矩阵 ,其 每 个 元 素 等 概率 地 取 从 0 到 9 的 整数 值 ,就 
不 妨 建立 如 下 的 函数 M 文件 . 


function a= randintCm ,ny) 


% RANDINT Randomly generated integral matrix. 
% randinttm,n) returns an m-by-n such matrix with entries between 0 and 9. 
a = floor(10 * rand( m,n)); 


当 需 要 一 个 这 样 的 2X3 随机 和 抵 阵 时 ,只 需 
》x= randint(2 ,3) 口 


.x 三 
9 6 8 


2 4 7 


MATLAB 的 M 文 件 中 % 后 面 是 注释 部 分 ,MATLAB 执行 时 忽略 这 些 内 容 . 函数 M 
文件 中 紧 跟 在 西数 名 后 的 注释 语句 给 出 了 这 个 西数 的 在 线 帮助 内 容 , 实 际 上 MATLAB 
的 所 有 库 函 数 都 有 这 样 一 段 注释 . 

函数 M 文件 有 多 个 因 变 量 时 ,要 用 [将 它们 括 起 来 ， 请 着 下 例 ， 

function fmean，stdev] = stat(x) 

% STAT Mean and standard deviation 


% Fora vectorx, stat(x) returns the mean and standard devi 


% Foramatrix x, stat(x) returns two row vectors containing， 
% the mean and standard deviation of each column. 
fm n] = size(x); 

ifm==1 


a 


二 
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m= n; % handle case of a row vector 
end 
mean = sum(x)/m:; 


stdev = sqrt(sum(x.°2)/m 一 mean. 2); 
其 用 途 不 难 从 注释 行 知道 . 当 求 一 个 数组 x 的 平均 值 和 均 方差 时 ,只 需 : 


》x=12 4 —705—1]1;Lxm,xd]= stat(x) 口 


xm 一 


0.5000、 
xd 一 
3.9476 


函数 M 文件 中 的 变量 一 般 是 局 部 变量 ,它们 的 变量 名 独立 于 目前 的 工作 区 和 其 他 的 
函数 .对 于 MATLAB5.0 以 上 的 版 本 ,在 工作 区 和 函数 的 定义 中 可 以 用 global 命令 把 某 
些 变量 说 明 为 全 局 变量 . 

。 函数 参数 的 个 数 和 可 变 的 参数 个 数 

在 MATLAB 中 允许 在 不 同 目录 下 的 文件 名 是 相同 的 , 当 MATLAB 执行 到 M 文件 
名 的 语句 时 , 它 首先 搜索 当前 工作 区 中 的 变量 和 内 建 的 命令 ,然后 搜索 有 无 内 部 函数 以 此 
命名 ,最 后 在 搜索 路 径 的 目录 中 寻找 第 一 个 以 此 命名 的 M 文件 . 函数 也 可 以 重 载 , 即 对 于 
同名 的 函数 根据 调用 的 参数 确定 使 用 那个 函数 . 

函数 M 文件 中 可 以 用 nargin 和 nargout 检查 输入 和 输出 参数 的 个 数 . 如 : 


function [c,d] = testargl(a,b) 


if (nargin = = 人) 

c= a.’2; % 只 有 一 个 输入 参数 时 ,计算 其 平方 
elseif. (nargin = = 2) 

c= a.-2 二 b.-2; % 有 两 个 输入 参数 时 ,计算 其 平方 和 
end 
if (nargout = = 2) % 有 两 个 输出 参数 时 执行 下 面 命令 


d = ‘This is an example for testing two output variables'; 
end 
实际 上 ,nargin 和 nargout 是 库 函 数 , 可 以 检查 任何 了 水 数 M 文件 的 输入 和 输出 参数 的 
个 数 ,如 
nargin (polyval) 


ans = 
4 


给 出 的 是 polyval. m 函数 (计算 多 项 式 的 值 的 函数 ) 的 输入 参数 的 个 数 (最 多 可 能 的 参数 
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个 数 ). 
函数 M 文件 中 还 可 以 用 varargin 和 varargout 实现 可 变 长 度 的 输入 和 输出 参数 的 个 
数 , 增 加 函数 调用 的 灵活 性 , 如 : 
function [msg, varargout] = testvar(x0,y0,varargin) 
fork = 1 : length(varargin) 
x(k) = varargin(k} (1); % varargin 是 元 胞 阵列 
yk) = varargin(k}(2); 


end 

xmin = min(x0,min(x)); 

ymin = min(y0 ,minCy)); 

axis([ xmin fix(max(x))+3 ymin fixCmax(y)) 十 3]) 

plotCx, y) 

for k = 1 : min(length(varargout), length(varargin)) 
varargout(k) = varargin{k}; “ % 将 输入 拷贝 到 输出 
varargout(k) = varargin{k}; 

end 

msg= 'successful' 


这 时 ,诸如 下 面 的 几 种 调用 方式 都 是 合法 的 : 


str=testvar(0,0,[2 3],[1 5],[4 8],[6 5],[4 2],[2 3]) 
[str,a,b,c]j= testvar(—5,—10,[—10],[53 —5],[42],[C1 1]) 


。 子 函 数 和 私有 函数 

在 M 文件 中 还 可 以 引用 其 他 M 文件 ,包括 递归 地 引用 自己 . 此 外 ,一 个 函数 M 文件 
中 还 可 以 定义 子 函 数 ( 仅 供 该 函数 M 文件 自己 调用 ). 例如 前 面 的 testarg1 函数 可 以 先 编 
两 个 子 函数 : 

function x= sub1l(y) % 子 沙 数 

X 一 Y-. 2; 

end : 
function x 二 Sub2(y,z) ”% 子 函 数 
x= sub1(y) + sub1(z); 
end 


再 编写 以 下 函数 


function fc,d] = testsubfun(a,b) 
if (nargin = = 1) 
c = subl(a); % 只 有 一 个 输入 参数 时 ,计算 其 平方 


elseif (nargin = = 2) 
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c = sub2(a,b); % 有 两 个 输入 参数 时 ,计算 其 平方 和 
end 
if (nargout = = 2) % 有 两 个 输出 参数 时 执行 下 面 命 令 

d = "This is an example for testing sub-function'; 
end 


在 MATLAB 中 还 可 以 定义 私有 函数 . 在 当前 目录 下 建立 一 个 子 目录 private, 那么 
该 子 目录 下 的 任何 函数 M 文件 都 是 当前 目录 的 私有 函数 ,只 能 供 当 前 目录 下 的 M 文件 
调用 . 请 读者 不 妨 试 试 . 

一 般 情况 下 MATLAB 执行 时 不 显示 M 文件 中 的 内 容 ,不 过 命令 echo on 可 以 让 
MATLAB 显示 M 文件 中 的 命令 ,并 且 用 命令 echo off 关闭 显示 . 


5.6 数据 文件 的 读 写 

在 MATLAB 编程 中 可 能 要 读 写 其 他 数据 文件 (如 读 写 其 他 包含 数据 的 文件 ). 前 面 
介绍 的 save 和 load 函数 可 以 完成 一 部 分 这 样 的 工作 ,这 里 再 介绍 见 个 文件 处 理 函 数 . 

可 以 用 dimread 读 人 带 分 隔 符 的 文本 文件 中 的 数据 ,用 法 是 : 

M = dlImread(filename ,delimiter) 


这 里 filename 是 文件 名 ,delimiter 是 文件 中 的 分 隔 符 名称 ( 缺 省 为 逗号 “\t 为 TAB 键 )， 
读 人 数据 存放 于 矩阵 M 中 . 类 似 地 ,可 以 用 下 面 的 形式 将 矩阵 M 写 人 文件 : 


dimwrite (fitename , M, delimiter) 


类 似 的 文件 处 理 函 数 还 有 textread,csvread,csvwrite( 这 里 的 后 两 个 函数 只 允许 分 隔 
符 为 逗号 ) 等 . 

对 于 二 进 制 数 据 , 可 以 用 与 C 语言 类 似 的 用 法 读 写 数据 .这 时 在 读 写 文件 之 前 , 需 
要 用 

fid = fopen(Gfilename', "permission') 
语句 打开 文件 ,其 中 filename 是 文件 名 ,而 permission 可 以 是 %r”( 只 读 ),“w”( 只 写 ),“a” 
(追加 ),“r 十 ”( 读 写 ) 等 选项 . 读 文 件 可 以 用 fread 函数 , 写 文件 可 以 用 fwrite 函数 ,操作 完 
成 后 用 fclose 关闭 文件 . 如 下 面 的 语句 将 5 阶 幻 方 阵 写 入 二 进 制 文件 magic5. bin: 

fwriteid = fopen('magic5.bin','w'); 

count = fwrite(fwriteid,magic(5) ,'int32°); 

status = fclose(fwriteid); 

对 于 格式 化 的 文本 数据 ,也 可 以 用 与 C 语 言 类 似 的 fscanf 和 fprintf 函数 进行 读 写 ,这 
里 就 不 详细 介绍 了 . 值得 说 明 的 是 ,MATLAB 文件 菜单 中 的 “Import Data” 命 令 可 以 帮助 
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从 外 部 文件 中 读 入 数据 . 
6 符号 工具 箱 使 用 简介 


MATLAB 系统 本 来 只 能 做 数值 计算 ,并 没有 符号 运算 的 功能 ,符号 运算 工具 箱 
(symbolic math toolbox) 则 扩充 了 MATLAB 这 方面 的 功能 , 它 是 购买 Maple 软件 的 核 
心 模块 后 完成 的 . 

这 个 工具 箱 在 MATLAB 中 的 目录 是 Toolbox/Symbolic ,这 里 只 对 它 的 常用 功能 作 
一 简单 介绍 ,详细 用 法 请 参阅 帮助 系统 . 


6.1 符号 变量 与 符号 表达 式 


符号 运算 工具 箱 处 理 的 主要 对 象 是 符号 和 符号 表达 式 , 为 此 要 使 用 一 种 新 的 数据 类 
型 一 一 符号 变量 ,工具 箱 用 sym 来 定义 一 个 符号 或 符号 表达 式 ， 如 


》sym(CxD 


ans= 
x 

r= symC(t 十 sqrt(x))/2) 口 
r 三: 

(1 十 sqrt(x))/2 
而 syms 可 定义 多 个 符号 ,如 
》symsabckty 
f=ax (2 x*x—t)°3+bx sin(4x y) 品 
f= 

ax (2x*X—{1)"3+bx sin(4 x y) 
可 以 在 上 面 定义 的 最 后 指明 符号 变量 的 类 型 ,如 指明 为 实数 : 


》syms abckty real 


上 面 定 义 的 各 个 符号 和 表达 式 1,f 可 以 进行 计算 ,如 


》g=f 十 ax (2x*r— 1)°3 
og 
ax(2xxX 一 t"3 十 bx sin(4* y)+ax x(3/2) 


用 findsym 来 确认 符号 表达 式 中 的 符号 ,如 


findsym( g) 


ans 二 


ee 
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6.2 微 积分 运算 
设 ab, {t，x, y 是 已 输入 的 符号 变量 . 
(1) 导数 


diff(f) 函数 f 对 符号 变量 x 或 (字母 表 上 ) 最 接近 字母 x 的 符号 变量 求 导数 
diff(f,t) 函数 人 对 符号 变量 t 求 导数 
Y= sin(a* x)ig= diff(f) 口 
g= 
Cos(ax*x)x*a 
)f= sin(a* t) ;g= diff(f) 口 
g= 
cos(axt)x*xa 
f= sin(y x* t) ;g= diff(f) 口 ] 
g= 
Cos(yxt)xt 
)f=sin(y* t);g= ditt(f,t 口 (这 可 以 看 作 二 元 函数 求 偏 导数 ) 
g= 
cos(y*t)xy 


对 于 上 面 的 函数 f 还 可 以 用 diff(f,2) 求 二 阶 导 数 : 


f= sinCax x);diff(f,27) 口 ] 
ans 一 
—sin(a* x) * ar2 
》aiff(f,a,2) 口 
ans = 
一 Sin(ax xX) x* X"2 


当 微 分 运算 作用 于 符号 矩阵 时 ,是 作用 于 矩阵 的 每 个 元 素 ,如 : 


3》A= [sin(ax x),cos(ax x);— cos(ax x),—sin(ax x)],dy= diff(A) 口 
一 
[sin(ax x), cos(ax x)] 
[一 cos(axXx)， 一 Sin(axX)] 
dy 一 
[cos(ax x) *a, —sin(ax x) * a]j 
[sin(ax x) *a, ~ cos(ax x)*al] 
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(2) 积分 


int(f) 函数 f 对 符号 变量 x 或 最 接近 字母 x 的 符号 变量 求 不 定 积分 
int(f,t) 函数 f 对 符号 变量 t 求 不 定 积分 
3 江 = sin(a x* x) ;g= int(f)[ 品 
g = 

—cos(ax x)/a 
3= sin(a* x);g= int(f,a) 口 ] 
g = 


— cos(ax Xx)/x 
= exp( — x*2) ;g= int(f) 口 
g we 


1/2 x pi(1/2) x erf(x) 
最 后 一 个 积分 无 简单 的 解析 表达 式 , 是 用 函数 erf 表达 的 , eri (x) 的 定义 是 
| 2 
0 Vx 
intCf, a,b) 函数 f 对 符号 变量 x 或 最 接近 字母 x 的 符号 变量 求 从 a 到 b 的 定 积 分 
int(f,t,a,b) ”应 数 ff 对 符号 变量 1+ 求 从 a 到 b 的 定 积分 


f= sin(a x x) ;g= int(f,0 ,pi) 品 
9 一 


—cos(pix a)/a+ 1/a 


Dsyms a x real;f= exp( — ax*x2);g = int(f, x, — inf, inf) 


9 = 
PIECEWISEC[1/a*C1/2) * pi*(1/2), signumla) = 1],[Linf, otherwise]) 
》pretty(g) % 以 更 容易 阅读 的 形式 显示 结果 


{ 1/2 
{ pi 

{ ---- signum(a~) = 1 
{ 1/2 
{a~ 

( 

{ 


Inf otherwise 
上 面 表 达 式 中 a 后 面 的 ~ 表示 a 是 实数 , signum(a~) 二 1 表示 a 之 0. 
当 不 定 积分 无 解析 表达 式 时 ,可 用 double 计算 其 定 积分 数值 ,如 


= exp( 一 x2);g= int(f;0,1) 口 
g= | 


a 
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1/2 x erf(1) x PC1/2) 
》a= double(g) 口 
二 要 
0.7468 


(3) 极限 


limit(f) 当 符 号 变量 x( 或 最 接近 字母 x 的 符号 变量 ) 一 0 时 函数 f 的 极限 
“limit(f,t,a)” 当 符号 变量 ta 时 函数 f 的 极限 
3f= sin(x) /x;9= limit(f) 口 
g= 
1 
limitCCcosC(xt+ a) 一 cos(x))/asa,0 ) 口 ] 
ans= 
一 sinCx) 
PimitCC1 + x/t)-t,t, inf ) ODO 
ans 二 
explx) 


下 面 的 例子 说 明 求 左 极 限 和 右 极限 的 方法 : 


limitC1/x) 口 


ans = 
NaN 
imitC 1/x ,x,0, "eft") 品 
ans = 
— inf 
DimitC 1/x, x,0,'right") 口 
ans 三 
inf 
(4) 级 数 和 
symsum(s,t,a,b) 表达 式 s 中 的 符号 变量 t 从 a 到 ob 的 级 数 和 (t 缺 省 时 设 定 为 x 或 最 接近 x 的 
字母 ) 
»symsum( 1/x,1,3) 口 
ans = 
11/6 
》s1= symsum( 1/x°2,1,inf) ,s2= symsumlxk,k,0,inf) OD 
S1 一 
1/6 x pr2 
s2 = 


—1/(x—1) 
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(5) 泰勒 多 项 式 


taylor(f,n,a) 函数 f 对 符号 变量 x( 或 最 接近 字母 x 的 符号 变量 )=a 点 的 n 一 1 阶 泰勒 多 项 式 
(n 缺 省 时 设 定 为 n=6,a 缺 省 时 设 定 为 a=0) 
dtaylorCsinCx) ) [OL] 
ans = 
x— 1/6 x x*3+ 1/120 x x°5 
f= log(x);s=taylor(f,4,2)0O 
s= 
log(2)+ 1/2x x—1— 1/8* (x—2)°2+1/24 * (x—2)°3 


6.3 解 方程 


(1) 非 线性 方程 (组 ) 


solve(f,t) 对 f 中 的 符号 变量 t 解 方程 f=0(t 缺 省 时 设 定 为 x 或 最 接近 x 的 字母 ) 
=ax x2+bxx+c;s= solve(f) 品 


S 一 


[1/2/ax (一 b+(b2 一 4#*axc) (1/2))] 
[1/2/ax (一 b 一 (b2 一 4x* axc) (1/2)) 
)f=axx2 十 bx x+ 二 cisolyve(f,b) 口 
ans 二 
— (axx2+c)/x 


如 果 要 解 形 如 f(z) 二 glx) 形式 的 方程 ， 则 需要 用 单 引 号 把 方程 括 起 来 ， 如 


»》s= solve('cos(2 x* x)+ sinCx) =1) 


S 一 


[ 
[ pi ] 
[ 1/6* pi 
[ 5/6xpi] 
solve 也 可 以 解 方 程 组 ,如 


PLx,y]= solve('x*2+xxyt+y=3','Xx2—4*xXx+3=0") 


和 
[ 1 
[ 3] 

y = 
[ 1] 
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即 方 程 组 的 解 为 (1,1) 和 (3, 一 讨 ). 
(2) 微分 方程 
dsolve(l'S','s1','s2',...,'X') 
其 中 S 为 方程 ,s1,s2,... 为 初始 条 件 ,x 为 自 变量 .方程 S 中 用 D 表示 求 导数 ,D2,D3,.… 


表示 二 阶 、 三 阶 等 高 阶 导数 ;初始 条 件 缺 省 时 给 出 带 任意 常数 C1,C2,… 的 通 解 ; 自 变量 缺 
省 时 设 定 为 t .举例 如 下 : 


》dsolveGCDy=1+y ”20 口 ] 


ans = 

tan(t— C1) 
y= dsolveC'Dy= 1+y “2','y(0) 三 1 xD 口 ] 
y = 


tan(x+ 1/4 x pi) 
》x= dsolve('D2x 十 2* DIx+2*x x=exp(t)','x(0)=1','Dx(0)=0°0D 
Ne 

1/5 x (exp(t) "2 十 3x sin(t)+ 4 * cos(t))/exptt) 


dsolve 也 可 用 来 解 微 分 方程 组 ,如 
》S= dsolveGCDf = 3*#*f{+4xg', 'Dg = 一 4x*f+3xg) 吕 
S= 

f : [1x1 sym] 

g : [1x1 sym] 


计算 的 结果 返回 在 一 个 结构 S 中 , 为 了 看 到 其 中 f,g 的 值 , 可 以 


)f=S.1,g= S. gO 
f 一 
eXxp(3xt) x*cos(4xt)x*xC1l+exp(3 *t) x*sin(4*t)x C2 
9 ES 和 
—exp(3 x*xt)xsin(4x*t)x*xC1l+exp(3*t)*cos(4*t)x*C2 


6.4 线性 代数 


MATLAB 中 大 多 数 用 于 数值 线性 代数 计算 的 命令 ,都 可 以 用 于 符号 变量 线性 代数 
的 运算 ,如 


》A=[abc;bca;c abl;B=[11 1J';x=A\BD 
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[ 1/(a+c+b)] 
[1/(at+c+b)] 
[ 1/(a+c+b)] 

A1= triu(A) ,L= eig(A)OD 


Al= 
[a, b,c] 
[0,c,al 
[0,0，b] 
| 
[ a+c+b] 


[ (b2~bxa—cxb—cxat+a2+c2)*(1/2)] 
[~—(b*2~bxa—cxb—cxat+a2+c2)*(1/2)] 


6.5 化 简 和 代 换 
工具 箱 中 提供 了 许多 化 简 符 号 表达 式 的 函数 ， 具 有 专门 用 途 的 函数 及 其 功能 是 : 
collect ”合并 同类 项 
expand ”将 乘积 展开 为 和 式 
horner  ” 把 多 项 式 转换 为 典 套 表示 形式 
factor 把 多 项 式 转换 为 乘积 形式 
simplifty ”利用 各 种 恒等式 化 简 代 数 式 
请 看 下 例 : 


》collect(x3 十 2 x x"2 一 5x x2+4x*xx—3*x+12—3)0] 
ans= 
X"3 一 3x X"2 十 X 十 9 
》g= collectC(C1 十 X)xt 十 txX) 呈 ] 
g= 
2xtxx+t 
》expand(Cx 一 1) x (x—2) x (X 一 3) 7) 器 
ans 二 
x3—6xx2+11ixx-—6 
》g= expand(cos(x+y))[0D 
g = 
COS(X) x COSCY) — sin(x) * sinCy) 


》expand(cos(3 x acos(x) )) 口 
ans 一 
4xXx3—3xx 
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》horner(x“3 一 6x* x2 十 11xxXx 一 6) 癌 ] 
ans = 

Xx(Xx(Xx 一 6) 十 11) 一 6 
3g= horner(1.1 十 2.2*X 十 3.3x x2) 口 ] 
g= 


11/10+ (11/5+ 33/10 x x) x* x 
》factor(x"3 一 6x x2+ 11* x—6)0 
ans = 
(Xx— 1) x (x—2) x (x—3) 
n= 1:5;x = xCones(size(n))); 
p= x.nt 1,f= factor(p) 品 
p= . 
[x 二 +1, Xx*2 十 1，x*3 十 1,，x*4 十 1，x*5 十 1] 
f= 
[ x 二 1，Xx2 十 1，(CXx 十 1) x 《x*2 一 x 十 1)， x4 十 1，Cx 十 1) x 《x*4 一 x*3 十 x*2 一 x 十 1)] 
DsimplifyC (1— x*2)/(1— x)) 口 


ans = 

x+1 
3s= simplify(sin(x)*2+ cos(x)"2) 口 
S 一 


1 
》q= simplify((1/a"3+6/a*2+12/at+8)*(1/3)) 口 
q= 

((2xa+1)°3/a'3)"(1/3) 


工具 箱 还 为 我 们 提供 了 一 个 强 有 力 的 函数 simple, 它 综合 运用 上 面 的 函数 进行 化 简 ， 
并 找 出 长 度 最 短 的 表达 式 , 其 命令 形式 有 以 下 几 种 : 
f= simple(S) 对 表达 式 S 进行 化 简 ,输出 长 度 最 短 的 表达 式 f 
simple(S) 对 表达 式 S 进行 化 简 ,输出 用 各 种 函数 化 简 的 结果 ,及 长 度 最 短 的 表达 式 
Lf,how]= simple(S) 对 表达 式 S 进行 化 简 , 输 出 长 度 最 短 的 表达 式 f 及 f 是 哪 一 个 函数 作用 的 
结果 how 
3f= simple(sin(x)"2+ cos(x)°2) 口 
f= 
1 

simple(1/a*3+6/a2+ 12/at 8)*(1/3) 口 

simplify : 


((2xat+1)°3/a3)°(1/3) 
radsimp : 
(2xat+1/a 


” 江 = subs(cos(a) 二 sin(b) ,La,bl],Lsym('alpha’) ,2]) 


6.6 
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combine(trig) : 
((1+6xat+12x*a2+8*a3)/a3)*(1/3) 


factor : 

((2xat+ 1)°3/a3)"*(1/3) 
expand : 

(1/a*3+6/a2+ 12/a+ 8)*(1/3) 
convert(exp) : 


(1/a3+6/a2+ 12/at+8)*(1/3) 
convert(sincos) : 
(1/a“3+6/a2+ 12/a+8) (1/3) 


convert(tan) : 

(1/ar3+6/a2+12/a+8) (1/3) 
collect(a) : 

(1/a3+6/a2+12/a+8) (1/3) 
ans = 


(2x*at+1)/a 
》[f,how]= simple(1/a*3+ 6/a2+ 12/a+ 8)*(1/3) 口 
f 三 
(2xa+ 1)/a 
how = 
radsimp 


工具 箱 中 提供 了 两 种 代 换 命令 ; 


subs(S,old,new) 用 符号 new 代替 表达 式 S 中 的 符号 old 
subexpr(S) 将 表达 式 S 中 的 公共 部 分 用 sigma 表示 
»subs(a+ b,a,4) 
ans = 

4+b 


ans = 
cos(alpha) + sin(2) 
subexpr 用 法 请 参阅 帮助 系统 


其 他 


工具 箱 中 提供 了 50 多 个 特殊 函数 ,如 贝 塞 尔 (Bessel) 函 数 、 椭 圆 积 分 \ 误 差 函 数 及 切 
比 雪 夫 (Chebyshev) 正 交 多 项 式 、 拉 格 朗 日 正 交 多 项 式 等 . 用 mfunlist 命令 可 以 看 到 这 些 


的 列表 ,用 


mhelp 二 函数 名 之 
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可 以 了 解 那个 函数 的 细节 . 
工具 箱 对 于 数值 计算 提供 了 有 理 数 计算 方式 和 可 变 位 数 的 浮 点 计算 方式 ,用 法 可 从 
下 例 看 出 ，; 


》a= 1/2+1/3,al= sym(a) ,a2= vpa(a,10) 品 


a= 
0.8333 

al = 
5/6 

a2 = 
.8333333333 


工具 箱 还 提供 了 一 个 非常 简便 的 画图 命令 : 设 表达 式 ff 中 只 有 一 个 符号 变量 ,比如 
x, 则 ezplot(f,xmin,xmax) 画 出 以 x 为 横 坐 标的 曲线 ,x 在 [xmin,;xmaxj 内 , 当 xmin， 
xmax 缺 省 时 xmin= 一 2 x pi,xmax 二 2x pi. 请 看 : 


YezplotCsinC2 * x) ) DD 
得 到 图 18. 
ezplotlsin(2 * t), -pi/2,pi/2) 口 
得 到 图 19. 
sin(2*x) sin(2*t) 
1.0 
0.5 
0 
-0.5 
一 1.0 
> SE i a 一 上 一 
-6 一 2 0 2 4 6 
X 
图 18 图 19 
练习 题 


五 3xs 及 :xz 


下 。 “| ,其 中 忆 ,R,0,5 分 别 为 单位 短 阵 、 随 机 逢 阵 、 堆 


1 设 有 分 块 短 阵 4 一 | 
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| . E RIRS 
矩阵 和 对 角 和 矩阵, 试 通过 数值 计算 验证 4e= | 。 | 

2. 用 命令 magic(m 生 成 幻 方 矩阵 ,通过 计算 研究 它 的 性 质 ,如 行 和 、` 列 和 、 两 条 对 角 
线 和 等 (可 以 利用 命令 fliplr,flipud， 其 用 法 可 以 查阅 MATLAB 帮助 系统 ). 

3. 设 访 二 1/(1 十 7 ) ,yz 二 exp( 一 TX/2),y3 王 sin2z,yi 王 V4 一 zx ,XZ 在 [一 2,2j] 内 适 
当 离 散 化 ,计算 妨 十 ya sy1y2 »y3/ YC5y4— y1)/y. 

4， 自己 选择 一 非 负 单调 递减 序列 al az, ,avars0,ai 远大 于 a,, 用 从 1 到 nn 和 
从 到 1 两 种 顺序 计算 2 a 观察 哪个 更 准确 些 , 分 析 原 因 . 


1 
5， 对 了, 二 | ze dz (n 二 0,1,2,…) 证 明 如 下 北 推 公式 : 

0 

l=1—e!, S 也 一 1 一 7 1， 7 一 1 2,… 


用 递 推 公式 计 算 了 ,1 ,…17, ,观察 n 多 大 时 结果 就 不 对 了 (考虑 一 个 简单 的 判断 结果 


错误 的 标准 ), 为 什么 会 出 现 这 种 情况 . 如 果 将 递 推 公式 反 过 来 ， 即 


T= (1 )/n; 
从 工 倒 过 来 计算 了 a 而 元 由 下 式 估计 
| 7 (2) es 
(mine ) = a i = (maxe ) = T 


不 妨 取 了 二 (1 十 1 )/2 ,将 计算 结果 与 前 面 的 进行 比较 ,得 到 什么 启发 ， 

6. 用 几 种 方法 作 x ,zzz 的 图 形 , 如 一 个 图 上 画 几 条 曲线 ， 用 subplot 作 多 幅 图 
形 等 ,考虑 如 何 画 上 z 轴 ,y 轴 , 并 在 图 上 加 各 种 标注 . 

7. 用 作 图 法 求 既 一 8lnz 和 4sinz 一 Z 一 2 一 0 的 根 的 近 斤 似 值 . 

8. 作曲 面 z= 一 y’ 的 三 维 图 形 . 

9. 图 20 中 电阻 RC( 二 Ri 十 Rs) 为 分 压 器 ,Ri 为 负载 电阻 , 试 将 分 压 比 y= 二 Ui/U 表示 
为 z= 二 Ri/R 和 a 二 RL/R 的 函数 ， 并 以 a 为 参数 (a 二 10， 1,0.1) , 作 函 数 >(z,a) 的 图 形 ,对 
结果 作出 解释 . 


10. 建立 M 文件 作 以 下 计算 : 
(1) 自然 数 的 阶乘 ; 


必 ci 吓 
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《2) nn 中 取 m 的 组 合 ; 
(3) 已 知 任意 两 个 多 项 式 ( 不 一 定 同 阶 ) 的 系数 , 求 它们 的 和 . 
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